X-Diffusion: クロスエンボディメント人間デモに基づく拡散ポリシーの訓練

X-Diffusion: Training Diffusion Policies on Cross-Embodiment Human Demonstrations

本研究では、ロボット学習における訓練データとしての人間のビデオデモの利点を活用した「X-Diffusion」というフレームワークを提案しています。人間とロボットが異なる身体特性を持つため、直接的な運動の再ターゲット化は物理的に不可能な動作を生むことがあり、この問題を解決します。X-Diffusionは、ノイズを加えることで低レベルの動作の違いを緩和しつつ、高レベルのタスク指導を保持するアプローチを用います。まず、ノイズを含む動作が人間かロボットかを予測する分類器を訓練し、その後、分類器が判断できない程度のノイズを加えた動作をポリシー訓練に組み込みます。この手法により、訓練されたポリシーはロボットに適合する動作を学習し、より高い成功率を達成しています。実験の結果、X-Diffusionは他の基準よりも16%高い成功率を示しました。