arXiv cs.AI

デモンストレーションからのパラメータ化されたスキルの学習

Learning Parameterized Skills from Demonstrations

http://arxiv.org/abs/2510.24095v1


本稿では、専門家のデモンストレーションからパラメータ化されたスキルを発見するためのエンドツーエンドアルゴリズムであるDEPSを提案します。この手法は、各タイムステップにおいて適切な離散スキルと連続パラメータを選択するメタポリシーと共にパラメータ化スキルポリシーを共同で学習します。時間的変分推論と情報理論的正則化手法の組み合わせを使用し、潜在変数モデルで一般的な退化の課題に対処し、学習したスキルが時間的に拡張され、意味的に有意義で適応可能であることを保証します。マルチタスクの専門家のデモンストレーションからパラメータ化されたスキルを学習することで、未知のタスクへの一般化が顕著に改善されることを実証します。また、DEPSは、グラスポジションを定義する連続引数を持つ物体グラスピングスキルなど、解釈可能なパラメータ化されたスキルを発見することを示します。