AgenticMath：エージェントベースの数学データ生成によるLLM推論の強化

この記事では、Large Language Model（LLM）の推論を改善するための高品質な数学の問題と解答ペアを生成する新しい手法「AgenticMath」を提案しています。従来のデータ生成方法では低品質な回答や情報の不足が課題とされています。本手法は4つの段階からなり、まず情報量が豊富で明確な質問を選別し、次にマルチエージェントシステムを用いて多様で一貫性のある質問を生成します。さらに、思考の連鎖を利用して答えを改良し、最後に最も優れた質問と回答のペアのみを保持します。実験により、AgenticMathで生成された30,000～60,000の数学サンプルで学習した3B-8BパラメータのLLMは、より多くのデータを用いたベースラインと比べても競争力のある性能を示しました。この研究は、質の高いデータ生成がLLMの数学的推論を向上させるより効率的な方法であることを示しています。