arXiv cs.AI

IPR-1: インタラクティブ物理推論器

IPR-1: Interactive Physical Reasoner

http://arxiv.org/abs/2511.15407v1


本論文では、人間が環境と相互作用しながら物理や因果関係を内面化する過程を模倣できるエージェントの学習能力について探求します。「Game-to-Unseen(G2U)」という設定で、1000以上の異種ゲームを使い、人間のような生存、好奇心、効用の観点から評価します。分析の結果、VLM/VLAエージェントは理由付けができるものの、対話的な環境での先読みが不足しており、世界モデルは物理や因果を分析するのではなく視覚パターンを模倣することが判明しました。そこで、我々はIPR(インタラクティブ物理推論器)を提案し、世界モデルを用いてVLMの方針を強化し、物理中心のアクションコード「PhysCode」を導入します。1000を超えるゲームで事前学習したIPRは、人間に似た三つのレベルで堅固に機能し、GPT-5と並ぶ結果を示しました。さらに、パフォーマンスはトレーニングゲームと相互作用のステップが増えることで向上し、未知のゲームへのゼロショット転送も可能です。これらの結果は、物理中心の相互作用が物理的推論を向上させる道であることを支持します。