arXiv cs.LG

Q-RAG: 長文コンテキストにおける価値ベースのエンベッダー訓練による複数段階の情報検索

Q-RAG: Long Context Multi-step Retrieval via Value-based Embedder Training

http://arxiv.org/abs/2511.07328v1


この記事では、Q-RAGという新たな情報検索手法が提案されています。既存のRetrieval-Augmented Generation(RAG)手法は、単一段階の情報検索に依存しているため、複雑な質問に答える際には不十分です。これに対抗する形で、Q-RAGは強化学習を用いてエンベッダーを訓練し、効率的に長文コンテキストに基づく多段階検索を実現します。特に、BabilongとRULERといった評価基準で、最大10Mトークンのコンテキストに対して優れた結果を示しています。この手法は資源効率に優れ、大規模な言語モデルの活用を促進します。