arXiv cs.AI

FreeAskWorld: 人間中心の具現化AIのためのインタラクティブでクローズドループのシミュレーター

FreeAskWorld: An Interactive and Closed-Loop Simulator for Human-Centric Embodied AI

http://arxiv.org/abs/2511.13524v1


この記事では、「FreeAskWorld」という新たなインタラクティブシミュレーションフレームワークを紹介しています。これは、人間中心の社会的行動を模倣するために大規模言語モデル(LLM)を統合しており、意図や社会的認知の理論に基づいています。本フレームワークは、リアルな人間-Agentシミュレーションをサポートし、多様な体現型AIを対象にしたモジュラーなデータ生成パイプラインを含んでいます。また、従来の視覚と言語のナビゲーション(VLN)タスクから発展させた新しい環境で、エージェントがナビゲーションの指導を積極的に追求し、解釈する能力も強化しています。FreeAskWorldは、再構築された環境、6つの異なるタスクタイプ、16の基本オブジェクトカテゴリ、63,429の注釈付きサンプルフレーム、17時間以上のインタラクションデータを含むベンチマークデータセットを公表しました。実験結果は、FreeAskWorldで微調整されたモデルが元のモデルよりも優れた意味的理解と相互作用能力を持つことを示しています。このアプローチは、高度な計画と自然な人間-Agent相互作用を実現するための社会的に基づいたシミュレーションフレームワークの有効性を強調しています。