この研究では、潜在行動モデル(LAM)と世界モデルを共同で学習させる新しいアプローチ「CoLA-World」を提案しています。従来の手法ではLAMと世界モデルを別々に訓練するため重複した学習があり、その共適応能力が制限されていました。CoLA-Worldは、LAMの前方動的モデルを強力な世界モデルに置き換え、効果的に両者を共同訓練することで、この課題を克服します。具体的には、最初に重要なウェアオフフェーズを設け、最初から作成したLAMの表現を事前訓練された世界モデルと整合させ、共同進化のサイクルを実現します。結果として、CoLA-Worldは映像シミュレーションの質と視覚計画において、従来の二段階手法と同等またはそれ以上の性能を示し、分野における新たな堅牢で効率的なパラダイムを確立します。