自動運転におけるビジョン・ランゲージモデル(VLM)の安全性が十分に評価されていないという課題を扱っています。安全上の懸念が生じている中、著者たちは、外部環境リスクと車内運転行動の安全性を同時に評価するための初の包括的ベンチマーク「DSBench」を提案しています。このベンチマークは、外部環境リスクと車内運転行動安全という2つの主要カテゴリーで構成され、10の主要分野と28のサブカテゴリーに分かれています。さまざまな主流のオープンソース及びクローズドソースのVLMに対する広範な評価により、安全性が重要な状況でのパフォーマンスの大幅な低下が示され、緊急の安全問題が浮き彫りになりました。98,000のインスタンスからなる大規模データセットを構築し、そのデータセットで微調整することで既存のVLMの安全性が大幅に向上することが示されています。