本研究では、変形線状物体(DLO)の長期ルーティングタスクを解決するために、完全自律的な階層フレームワークを提案しています。DLOのルーティング目標を言語で表現し、視覚言語モデル(VLM)を活用して高レベルの推論を行い、実行可能な計画を合成します。この計画は、強化学習を通じて訓練された低レベルスキルによって実行されます。また、長期目標における信頼性向上のために、失敗回復メカニズムも導入されています。このアプローチは、多様なシーンや言語コマンドにおいて一般化可能であり、他の手法に比べて成功率92.5%を達成し、ほぼ50%の性能向上を示しています。