arXiv cs.AI

多エージェントLLMの推論力を解き放つ:怠惰なエージェントから熟慮へ

Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation

http://arxiv.org/abs/2511.02303v1


本論文では、強化学習と検証可能な報酬を用いて訓練された大規模言語モデル(LLM)が、複雑な推論タスクで優れた結果を示すことをではなく、多エージェント設定への拡張について議論します。この設定では、メタ思考エージェントが計画を提案し進捗を監視し、一方で推論エージェントが逐次的な会話ターンを通じてサブタスクを実行します。しかし、怠惰な行動が発生するという重要な制約があり、一方のエージェントが支配するあまり、他方の貢献が少なくなり、協力が損なわれることが指摘されます。論文では、この問題を軽減するための因果的影響を測定する安定で効率的な方法を提案し、さらに熟慮を促進するための検証可能な報酬メカニズムを導入しています。これにより、認知エージェントはノイズの多い出力を排除し、指示を統合し、必要に応じて推論プロセスを再起動できます。実験により、提案するフレームワークが推論における怠惰な行動を軽減し、多エージェントフレームワークの可能性を引き出すことを示しています。