情報検索において、ユーザーのクエリはしばしば曖昧であり、システムがユーザーの意図を特定するのが困難です。最近の対話型インタラクティブ検索システムはユーザーの意図を明確にすることができますが、最も情報価値の高い質問をする戦略が不足しており、効率的ではありません。これに対処するため、著者らは、強化学習を通じて最適な質問戦略を学習する対話駆動の検索フレームワーク「SherlockLLM」を提案します。このフレームワークでは、エージェントがバイナリ質問のシーケンスを生成し、検索空間を効率的に絞るように訓練されます。提案手法の検証のために、構造的および非構造的タスクのベンチマークも導入されています。実験結果は、SherlockLLMが堅牢で効率的な解決策であることを示しています。構造的タスクでは、性能が強力なベースラインに匹敵し、理論的な最適解に接近します。一方、難易度の高い非構造的タスクでは、著者らのエージェントが著しくベースラインを上回る結果を示し、情報探索の対話ポリシーを効果的に学習する能力を明らかにしました。