arXiv cs.AI

マルチモーダル大規模言語モデルにおける内因的テキストバイアスの解明:アテンションキー空間分析を通じて

Unveiling Intrinsic Text Bias in Multimodal Large Language Models through Attention Key-Space Analysis

http://arxiv.org/abs/2510.26721v1


この記事では、マルチモーダル大規模言語モデル(MLLM)が視覚と言語のデータを処理する際に、テキスト入力に対して著しい偏りを示す原因を探ります。従来の研究がデータの不均衡や指示調整といった外的要因を指摘したのに対し、本研究はこのバイアスがモデルの内部アーキテクチャに起因するものであると仮定します。具体的には、視覚的キーとテキストキーの間に分布上の違いが存在し、視覚キーが注意計算時に低い類似度スコアを受けることが示されています。これにより、視覚情報が文脈表現に適切に利用されないことが明らかになりました。LLaVAやQwen2.5-VLからキーべクトルを抽出し、分布構造を解析した結果、視覚とテキストのキーが明確に異なるサブスペースを占めていることが確認されました。この研究は、テキストバイアスが外的要因ではなく、アテンションキー空間内の内部的不整合から生じることを示しています。