この研究は、AIの発展におけるエージェント間の協力の重要性を強調しています。異なる情報や特権を持つ独立したエージェントを組み合わせたシステムの成功は、効果的なコラボレーションに依存しますが、その実現は難しいとされています。本論文では、コラボレーション能力を評価するためのベンチマークとして「協力的迷路解決」を提案し、複数のAIモデルの性能をテストしました。その結果、単体での性能が良好なモデルでも、協力時には性能が大幅に低下する「コラボレーションのギャップ」が見られました。特に、強力なエージェントが先行し、弱いエージェントに引き渡す「リレー推論」アプローチが、成功を収めることを示しました。本研究は、協力を考慮した評価方法やトレーニング戦略の必要性を訴えています。