本研究では、専門家の軌跡データセットを用いて、従来の模倣学習手法の限界を克服することを目指した「多モーダル拡散強制(MDF)」という統一フレームワークを提案します。従来の手法は観察データから直接アクションを学習するだけですが、MDFは異なるモダリティ間の関係に着目し、アクション生成を超えた学習を行います。具体的には、部分マスキングを用いて拡散モデルを訓練し、時系列やクロスモーダルの依存関係を学習します。シミュレーションと実環境における力強い操作タスクの評価では、MDFが多様な機能を提供し、騒音のある観測に対しても優れた性能とロバスト性を示すことが明らかになりました。この成果はロボット行動のモデル化やタスクの理解に寄与するものです。