この記事では、長期的なタスクに対処するためのリトリーバルベースのデモンストレーションクラスター化手法(RDD)が提案されています。この手法は、視覚と言語に基づくプランナーが複雑な操作タスクをより簡単なサブタスクに分解するのを助け、低次元の視覚運動ポリシーが容易に扱えるようにします。従来の方法では、ターゲットタスクのデモンストレーションが人間の注釈やヒューリスティックルールを用いてサブタスクに分けられますが、この方法だと訓練データとの乖離が生じ、タスク性能が低下することがありました。RDDは、デモンストレーションを自動的にサブタスクに分解し、視覚特徴を訓練データと整合させることでこの問題を解決します。実験によって、シミュレーションおよび実世界のタスクで最先端のサブタスクデコーダーより優れた性能を示し、多様な設定においても堅牢性を示しています。