この記事では、IMAGINEと呼ばれる新しいフレームワークを提案しています。このフレームワークは、複雑な推論と計画タスクにおいて、マルチエージェントシステム(MAS)の能力を一つのコンパクトなモデルに統合することを目指しています。従来の大型言語モデルは、複雑な推論において課題が多く、例えば、GPT-4oは特定のデータセットでわずか7%の合格率しか達成していませんでした。IMAGINEは、MASの構造化された推論能力を取り入れつつ、エンドツーエンドの学習によって、その性能を大幅に向上させることができます。実験結果によると、IMAGINEを用いたQwen3-8B-Instructモデルは、旅行プランナーのベンチマークで82.7%の合格率を達成し、従来のモデルを大きく上回る結果を示しています。このアプローチは、効果的な推論能力と計画機能をより効率的に実現する手段として期待されています。