arXiv cs.AI

境界を越えて:ソースフリーオブジェクト検出のためのビジョンファウンデーションモデルの活用

Beyond Boundaries: Leveraging Vision Foundation Models for Source-Free Object Detection

http://arxiv.org/abs/2511.07301v1


ソースフリーオブジェクト検出(SFOD)は、ソースデータにアクセスせず、ソースで事前学習したオブジェクト検出器をターゲットドメインに適応させる方法です。しかし、従来のSFOD手法はソースモデルの内部知識に依存しており、ドメイン間の一般化能力が制限され、バイアスのかかった擬似ラベルを生じることが多いです。これに対し、ビジョンファウンデーションモデル(VFM)は多様なデータで事前学習され、強力な認識能力と広範な一般化能力を持つものの、SFODの文脈ではその可能性が十分に活用されていません。本論文では、VFMを外部知識源として利用し、特徴の整合性とラベルの質を同時に向上させる新しいSFODフレームワークを提案します。具体的には、パッチ重み付きグローバル特徴整合性(PGFA)、プロトタイプベースインスタンス特徴整合性(PIFA)、双源強化擬似ラベル融合(DEPF)の3つのモジュールを設計しています。実験結果は、本手法がSFOD性能を大幅に向上させることを実証しています。