arXiv cs.AI

EBT-ポリシー: エネルギーが新たな物理的推論能力を引き出す

EBT-Policy: Energy Unlocks Emergent Physical Reasoning Capabilities

http://arxiv.org/abs/2510.27545v1


EBT-ポリシーは、ロボティクスにおけるポリシー学習とビジョン・言語・アクションモデルの新しいアプローチです。従来の生成モデルに基づくポリシーは計算コストが高く、不安定な推論動態が問題とされますが、エネルギーベースモデル(EBM)は、エネルギー宇宙を学習し、安定した平衡動態をモデル化することでこの問題を解決します。新たに提案されたEBT-ポリシーは、ロボットと実世界のタスクにおいて、拡張性と効率性を兼ね備えています。特に、このモデルは二回の推論ステップで収束することがあり、従来の拡散型ポリシーと比較して50倍の効率性を示します。また、明示的な再試行トレーニングなしに行動クローンのみで失敗したアクションからの回復も可能で、ロバストで一般化可能なロボット行動への新しい道を提示します。