経験に基づく推論時間戦略の適応

本記事では、推論時間における問題解決アプローチを適応させることを目指す人工知能システムの課題に焦点を当てています。既存のアプローチでは、言語モデルへの入力を修正することでしかシステムの誘導ができず、柔軟な適応にはオフラインでの最適化が必要でした。この問題を解決するために、著者たちは「経験に基づく推論器（EGuR）」を提案しています。このシステムは、過去の経験に基づき、推論時に動的に特定の戦略（LLM呼び出し、ツール、パラメータなどを含む）を生成します。EGuRは、現在の問題と過去の記憶をもとに複数の戦略候補を生成する「ガイド」と、実行フィードバックを統合して未来の戦略生成を改善する「コンサリデーター」の2つのコンポーネントから構成されます。多様なベンチマークでの実験結果により、EGuRは最大14%の精度向上と、最大111倍の計算コスト削減を達成しました。