スケールにおける実践的なコードRAG：計算予算に基づくタスク指向の情報 Retrieval 設計選択

Practical Code RAG at Scale: Task-Aware Retrieval Design Choices under Compute Budgets

本記事では、実際の計算予算の下でコードに特化した生成タスクにおける情報取得デザインを研究しています。Long Code Arena のコード補完とバグローカライズという二つの補完的なタスクを用いて、さまざまなコンテキストウィンドウサイズにわたる情報取得構成を系統的に比較しています。主な発見としては、PL-PLタスクには、単語レベルの分割を用いた疎なBM25が最も効果的であり、高密度の代替手段に比べて優れていること、NL-PLタスクでは、VOYAGER-3ファミリーなどの特許取得済みの密なエンコーダーが疎な検索方式を優位にしながらも、100倍の遅延が必要であることが挙げられます。また、最適なチャンクサイズは利用可能なコンテキストに応じてスケーリングし、32-64行のチャンクが小さな予算では最適であるとの結果が示されています。最後に、実証に基づいた効果的なコード指向のRAGシステムの実装における推奨を提供しています。