arXiv cs.AI

対照的トリガー学習を通じたMLLM具現化意思決定における視覚的バックドア攻撃

Visual Backdoor Attacks on MLLM Embodied Decision Making via Contrastive Trigger Learning

http://arxiv.org/abs/2510.27623v1


本記事では、マルチモーダル大規模言語モデル(MLLM)が具現化エージェントに直接的な視覚的認識、推論、および計画的な行動を可能にする一方で、新たな攻撃面として視覚的バックドア攻撃の脅威が浮上することを説明しています。視覚的トリガーがシーンに現れると、エージェントは通常の挙動から攻撃者が指定した多段階ポリシーを持続的に実行するようになります。著者らは、環境内のオブジェクトをトリガーとして用いるバックドア注入のための最初のフレームワークBEATを導入しました。BEATは、一貫したトリガーの実装を難しくする視点や照明によるオブジェクトの変動を扱うため、さまざまなシーンとタスク、およびトリガー配置を含むトレーニングセットを構築し、二段階のトレーニング手法を用いることで精度を向上させています。その結果、MLLMをベースにした具現化エージェントにおいて、最大80%の攻撃成功率を達成し、強力なベネフィットタスクのパフォーマンスを維持しつつ、トリガー配置の一般化にも成功しています。これは、MLLMに基づく具現化エージェントにおける新たなセキュリティリスクを浮き彫りにし、実社会での利用前に堅牢な防御策が必要であることを強調しています。