arXiv cs.AI

運転世界モデルの再考:知覚タスクのための合成データ生成器としての役割

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

http://arxiv.org/abs/2510.19195v1


最近の運転世界モデルの進展により、高品質なRGB動画やマルチモーダル動画の生成が可能となりましたが、これらは主に生成品質と制御可能性に焦点を当てているため、実際の自動運転性能に不可欠なダウンストリーム知覚タスクの評価が軽視されがちです。現行の手法では、合成データで事前トレーニングし、実データで微調整する戦略が取られていますが、この方法ではエポック数が2倍になり、合成データの利点が薄れることがあります。この問題を解決するために、著者らはDream4Driveという新しい合成データ生成フレームワークを提案し、知覚タスクの性能を向上させるための柔軟な多視点生成が可能です。また、大規模な3DアセットデータセットDriveObj3Dも提供し、運転シナリオにおける多様な3D対応動画編集を支援します。実験により、Dream4Driveがダウンストリームモデルの性能を向上させることを確認しました。