arXiv cs.LG

RAGBoost: 精度を保った文脈再利用による効率的な取得拡張生成

RAGBoost: Efficient Retrieval-Augmented Generation with Accuracy-Preserving Context Reuse

http://arxiv.org/abs/2511.03475v1


RAGBoostは、大規模言語モデル(LLM)を取得したコンテキストで強化する取得拡張生成(RAG)システムであり、長い複雑な入力を要求する現代のアプリケーションにおいて、事前フィル性能が低下する問題に対処しています。このシステムは、コンカレントセッションやマルチターンインタラクションにおける重複した取得アイテムを検出し、精度を保ちながら高いキャッシュ再利用を実現します。具体的には、効率的なコンテキストインデクシング、オーダリング、重複排除を用いて再利用を最大化し、軽量なコンテクストヒントが推論の信頼性を維持します。RAGBoostは既存のLLM推論エンジンとシームレスに統合され、最新の手法と比較して事前フィル性能を1.5〜3倍向上させ、異なるRAGおよびエージェントAIワークロードにおいて推論の精度を保つか、さらには向上させることができます。