arXiv cs.AI

バニラMLLMの偽造検出ポテンシャルを解き放つ:新しいトレーニング不要のパイプライン

Unlocking the Forgery Detection Potential of Vanilla MLLMs: A Novel Training-Free Pipeline

http://arxiv.org/abs/2511.13442v1


この記事では、人工知能生成コンテンツ(AIGC)技術の進展に伴い、画像生成や操作が容易になっている中で、画像偽造検出とローカリゼーション(IFDL)の課題を論じています。従来の手法は多様なデータセットに対する一般化能力に乏しく、解釈性も限られています。著者たちは、トレーニングを必要としない新しいパイプライン「Foresee」を提案し、これにより軽量な推論プロセスが可能となり、既存のMLLMベースの手法に対して、改ざんのローカリゼーション精度とテキスト説明の質が向上すると述べています。Foreseeは、特にコピー移動操作に対応するための戦略を採用し、実験では様々な改ざんタイプにおいて優れたパフォーマンスを示しました。最終版ではコードが公開される予定です。