arXiv cs.AI

物理に配慮したビデオ生成のためのスケッチ誘導検証を用いた計画

Planning with Sketch-Guided Verification for Physics-Aware Video Generation

http://arxiv.org/abs/2511.17450v1


最近のビデオ生成手法は、物体の軌道などの中間制御信号を計画することで、時間的一貫性や運動の忠実性を改善しています。しかし、多くの方法は単純な動作に限定された単発の計画に依存しており、または複数回の呼び出しを必要とする反復的な洗練を行い、高い計算コストがかかります。この課題を克服するために、著者らはSketchVerifyという、テスト時のサンプリングと検証ループを導入した訓練不要の計画フレームワークを提案します。この方法では、プロンプトと参照画像を基に複数の候補計画を予測し、意味的整合性と物理的妥当性を共同で評価するビジョン・ランゲージ・バリファイアを使用してランク付けを行います。実験により、提案手法が競合手法と比較して運動の質、物理的リアリズム、長期的一貫性を大幅に改善できることが示されています。