この記事では、自己改善を実現するコーディングエージェントの開発に関する新しいアプローチ、ハクスリー・ゲーデルマシン(HGM)について述べています。HGMは、エージェントの子孫のベンチマークパフォーマンスを指標として自己改善の可能性を評価する新しいメトリック(CMP)を用い、自己修正の木を探索します。HGMは、従来の自己改善コーディングエージェントの開発手法よりも優れた性能を発揮し、GPT-5-miniを用いたSWE-bench Verifiedで人間レベルのパフォーマンスを達成することが示されました。この結果は、HGMが他のコーディングデータセットや大規模な言語モデルに対しても強い転移能力を持つことを示しています。