arXiv cs.AI

プロセスシステム工学における強化学習手法の調査とチュートリアル

Survey and Tutorial of Reinforcement Learning Methods in Process Systems Engineering

http://arxiv.org/abs/2510.24272v1


本論文では、プロセスシステム工学(PSE)における不確実性下での逐次的意思決定に関連する問題に対して、強化学習(RL)の手法を調査し、チュートリアル形式で解説しています。従来の手法は、複雑で確率的なシステムの制御や最適化において制約があるため、データ駆動型のRLアプローチが有効です。著者らは、RLの基本概念と主要なアルゴリズム群(価値ベース、ポリシーベース、アクター-クリティック法など)を詳細に説明し、その後、PSEのさまざまな分野における既存のRL技術の応用例を紹介しています。最後に、PSEに特化した技術と今後の研究の方向性について議論し、RLアルゴリズムの発展状況やPSEへの影響を整理しています。