VT-Refine: 視覚・触覚フィードバックを通じての二手組立学習のためのシミュレーション微調整

VT-Refine: Learning Bimanual Assembly with Visuo-Tactile Feedback via Simulation Fine-Tunin

本研究では、VT-Refineという二手組立タスク向けの視覚・触覚ポリシー学習フレームワークを提案しています。人間は豊富な触覚フィードバックに適応することで二手組立を得意としますが、この能力をロボットに模倣させることは難しいです。私たちは、実デモ、精密触覚シミュレーション、強化学習を組み合わせて、精緻で接触が多い二手組立を実現します。最初に視覚と触覚の入力を用いて拡散ポリシーをトレーニングし、その後シミュレーション環境でポリシーを微調整します。高解像度の圧電抵抗性触覚センサーを活用し、現実とシミュレーション間での正確な転送を可能にしています。結果として、VT-Refineはシミュレーションと実際の組立性能を向上させ、多様なデータを増やし、より効果的なポリシー微調整を実現しています。