arXiv cs.AI

品質に配慮した多言語RAGシステムにおける翻訳タグ付け

Quality-Aware Translation Tagging in Multilingual RAG system

http://arxiv.org/abs/2510.23070v1


この記事では、多言語情報検索強化生成(mRAG)システムにおける翻訳品質を評価する「品質に配慮した翻訳タグ付け(QTT-RAG)」の提案が紹介されています。mRAGシステムは、低リソース環境下で英語文書を取得し、クエリ言語に翻訳して応答を生成しますが、翻訳品質が低いと性能が低下します。既存の方法は翻訳品質が十分であることを前提とするか、情報の歪曲や幻想を引き起こす再構成手法を使用しています。QTT-RAGは、意味的等価性、文法的正確性、自然さと流暢さの三つの観点から翻訳品質を評価し、そのスコアをメタデータとして元の内容を変更せずに付加します。評価の結果、QTT-RAGは二つのオープンドメインQAベンチマークにおいてベースラインを上回り、情報の正確性を保ちながら翻訳の信頼性に基づくインフォームドデシジョンを可能にしました。この手法は、限られたネイティブ言語の文書しかない低リソース環境におけるクロスリンガル文書の効果的な活用を提供し、マルチリンガルドメインでの実用的かつ堅牢な解決策を示しています。