arXiv cs.AI

AlphaOPT: 自己改善型LLM経験ライブラリを用いた最適化プログラムの定式化

AlphaOPT: Formulating Optimization Programs with Self-Improving LLM Experience Library

http://arxiv.org/abs/2510.18428v1


AlphaOPTは、限られたデモンストレーションから自己改善を促進する経験ライブラリを活用し、最適化モデルの自動化を目指す新しいアプローチです。これにより、非定型な言語を正確な数学的定式や実行可能なソルバーコードにマッピングする課題を解決します。これまでのアプローチは脆弱なプロンプティングや高コストの再訓練に依存していましたが、AlphaOPTは、ディスプレイされた答えやソルバーフィードバックを活用し、注釈付きの論理トレースやパラメータ更新なしで学習を行います。AlphaOPTは、失敗を反省し、ソルバーによって確認された構造化された洞察を抽出する『ライブラリ学習フェーズ』と、リトリーバル不整合を診断し、保存された洞察の適用条件を洗練する『ライブラリエボリューションフェーズ』から成る二段階のサイクルで運営されます。この設計により、効果的に学習し、モデルの重みの更新なしでライブラリを拡張し、人間が理解可能で介入可能な知識を明示化します。実験結果は、データの増加に伴いAlphaOPTが着実に改善し、関係するタスク間での転送を向上させることを示しています。