arXiv cs.LG

人間とモデルの視点をつなぐ:大規模言語モデルを用いたニュースメディアにおける政治的バイアス検出の比較分析

Bridging Human and Model Perspectives: A Comparative Analysis of Political Bias Detection in News Media Using Large Language Models

http://arxiv.org/abs/2511.14606v1


ニュースメディアにおける政治的バイアスの検出は、微妙な言語的および文脈的手がかりを解釈する必要があり、複雑な作業です。本研究では、大規模言語モデル(LLM)と人間の判断との調和の程度を評価する比較フレームワークを提案します。特に、GPT、BERT、RoBERTa、FLANなどの複数のLLMを用いて、人間の注釈とモデルの検出結果を比べます。手動で注釈されたニュース記事のデータセットを作成し、バイアスの極性やモデル間の一致度を評価。実験結果から、伝統的なトランスフォーマモデルではRoBERTaが人間のラベルとの整合性が最も高いことが示され、生成モデルではGPTがゼロショット設定において人間の注釈との強い一致を示しました。これにより、人間とLLMsが政治的傾向をどのように認識するかの体系的な違いが浮き彫りになり、人間の解釈可能性とモデルのスケーラビリティを結びつけるハイブリッド評価フレームワークの必要性が強調されます。