arXiv cs.AI

統計的観点から見た多言語ギャップの再考

Rethinking Cross-lingual Gaps from a Statistical Viewpoint

http://arxiv.org/abs/2510.15551v1


この記事では、知識が自然言語で表現される際に生じる「多言語ギャップ」に焦点を当てています。これまでの研究は、ソース言語とターゲット言語の潜在表現の乖離がこのギャップの原因とされていましたが、本研究ではターゲット言語での応答のばらつきが主な原因であると仮定しています。初めてバイアス-バリアンス分解の観点から多言語ギャップを形式化し、実験的証拠を提示しました。さらに、応答のばらつきを制御しギャップを縮小するさまざまな介入実験を通じて仮説を強化しました。シンプルなプロンプト指示を用いて応答のばらつきを減少させた結果、ターゲット精度が20~25%向上したことを示しています。