本研究では、PluriHopというQAアーキテクチャを提案します。これは、医療記録やコンプライアンス文書など、複数の文書から情報を集約する必要がある「プルリーホップ」質問に対応しています。特に、すべての文書を考慮する重要性と、1つのパッセージを見逃すことによる高いリコール感度に注目しています。プルリーホップ質問に基づいて構築された診断用の多言語データセットPluriHopWINDを紹介し、これは他のデータセットよりも8-40%も繰り返しが多いことを示しました。従来のRAGパイプラインを使った結果、どの手法も40%未満のF1スコアに留まりました。これを受けて、提案されたPluriHopRAGは、個々の文書を確認し、不要なものを早期に除外するアプローチを取ることで、18-52%の相対的なF1スコアの改善を実現しています。この研究は、リコールに敏感なリトリーバルの価値を強調しています。