本稿では、視覚言語モデル(VLM)をロボティクスの閉ループ記号的計画者として使用する方法を制御理論の視点から探究します。大規模言語モデル(LLM)やVLMは、具象的な記号プランニングに幅広く使用されているものの、閉ループでの利用に関してはまだ未開拓の部分が多いです。これらのモデルはブラックボックスとして動作し、予測不可能なエラーを引き起こす可能性があるため、高度なロボティクス計画には特に挑戦が伴います。著者は、制御ホライズンやウォームスタートがVLMの性能に与える影響を実験により検証し、VLMを閉ループ記号的計画者として利用する際の有効な洞察を提供します。それにより、VLMの性能向上につながる推奨事項を議論しています。