本論文では、リトリーバル強化生成(RAG)の品質と性能を共同最適化するためのフレームワーク「RAG-スタック」を提案しています。RAGはベクトルデータベースから取得した文書を大規模言語モデルのプロンプトに統合する手法で、より信頼性が高く情報価値のあるコンテンツ生成を可能にします。しかし、RAGパイプライン全体の文脈で考えると、多くの研究課題が残っています。特に、システム性能と生成品質を同時に最適化することは非常に複雑で、多数の要因が影響します。RAG-スタックは、(1)品質と性能を切り離す中間表現RAG-IR、(2)RAG-IRに基づくシステム性能を推定するコストモデルRAG-CM、(3)高品質かつ高性能なRAG構成を探索する計画探索アルゴリズムRAG-PEの3つの柱から成ります。このアプローチは、今後のRAGの品質と性能の共同最適化の基準となることが期待されます。