本研究では、物体とその相互作用を理解するエージェントが、より頑健で移転可能なポリシーを学習できることを提案しています。従来の物体中心の強化学習(RL)手法は、個々の物体によって状態を分解しますが、相互作用が暗黙的に扱われているため、効率が低くなることがあります。そこで、Factored Interactive Object-Centric World Model(FIOC-WM)という統合フレームワークを導入し、物体とその相互作用の構造化された表現を学習します。FIOC-WMは、明示的かつモジュール化された物体相互作用の表現を用いて環境の動態を捉え、ポリシー学習のサンプル効率と一般化を向上させます。具体的には、このモデルはまずピクセルから物体中心の潜在変数と相互作用の構造を学習し、タスクを組み合わせ可能な相互作用の基本要素に分解します。シミュレーションされたロボティクス及び具現化AIのベンチマークにおいて、FIOC-WMはポリシー学習の効率と一般化を向上させ、頑健な制御には明示的なモジュール化された相互作用学習が重要であることを示しました。