arXiv cs.LG

ゼロショット生成強化学習によるプラズマ形状制御

Plasma Shape Control via Zero-shot Generative Reinforcement Learning

http://arxiv.org/abs/2510.17531v1


従来のPIDコントローラーはプラズマ形状制御において柔軟性が限られており、タスク特化型の強化学習(RL)手法は一般化の限界や繰り返し再学習の必要から課題を抱えています。本論文では、大規模なオフラインデータセットを用いて、汎用的なゼロショット制御ポリシーを開発する新たなフレームワークを提案します。このアプローチは、生成的敵対模倣学習(GAIL)とヒルベルト空間表現学習を組み合わせて、PIDデータの安定した操作スタイルを模倣し、効率的で目標指向の制御のための幾何学的に構造化された潜在空間を構築します。得られたポリシーは、タスク固有の微調整を行わずに多様な軌道追跡タスクに適用可能です。実験により、提案したポリシーがさまざまなプラズマシナリオにおける重要な形状パラメーターの参照軌道を正確かつ安定して追跡できることが示されました。これは、未来の核融合炉に向けた高い柔軟性とデータ効率を持つ知的制御システムの開発に向けた実現可能な道筋を示しています。