本記事では、AgentFoldという新しいエージェントパラダイムを提案しています。このエージェントは、長期的なタスクにおいて情報収集を行う際のコンテキスト管理の問題を解決することを目的としています。従来のReActベースのエージェントは、ノイズの多い履歴を蓄積することでコンテキストの飽和が起こり、詳細が失われるリスクがあります。これに対抗するため、AgentFoldは人間の認知プロセスに着想を得て、コンテキストを受動的なログではなく、動的な認知ワークスペースとして扱います。各ステップで 'folding' 操作を実行し、歴史を複数のスケールで管理することができます。具体的には、重要な細部を維持するための微細な凝縮や、多段階のサブタスクを抽象化するための深い統合を行います。このアプローチにより、AgentFold-30B-A3BはBrowseCompとBrowseComp-ZHのベンチマークでそれぞれ36.2%と47.3%を達成し、大規模オープンソースモデルや、OpenAIのプロプライエタリエージェントを超える性能を示しています。