Agent0: ゼロデータからの自己進化エージェントの解放とツール統合推論

Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning

本記事では、Agent0という新しいフレームワークが紹介されています。従来の大規模言語モデル（LLM）エージェントは、人間が収集したデータに依存するため、スケーラビリティが制限され、AIの知識が人間に束縛されていました。Agent0は、外部データなしで高性能なエージェントを進化させるために、マルチステップの共進化を活用し、ツールをシームレスに統合します。二つのエージェント間の共生的競争を通じて、より難易度の高い課題を提案するカリキュラムエージェントと、それを解決するために学習する実行エージェントが連携します。このプロセスを通じて、Agent0は自己強化サイクルを確立し、高品質なカリキュラムを継続的に生成します。実験により、Qwen3-8B-Baseモデルの数学的推論能力は18%向上し、一般的な推論ベンチマークでは24%の向上が見られました。