プロセスシステム工学における強化学習手法の調査とチュートリアル

Survey and Tutorial of Reinforcement Learning Methods in Process Systems Engineering

本論文では、プロセスシステム工学（PSE）における不確実性下での逐次的意思決定に関連する問題に対して、強化学習（RL）の手法を調査し、チュートリアル形式で解説しています。従来の手法は、複雑で確率的なシステムの制御や最適化において制約があるため、データ駆動型のRLアプローチが有効です。著者らは、RLの基本概念と主要なアルゴリズム群（価値ベース、ポリシーベース、アクター-クリティック法など）を詳細に説明し、その後、PSEのさまざまな分野における既存のRL技術の応用例を紹介しています。最後に、PSEに特化した技術と今後の研究の方向性について議論し、RLアルゴリズムの発展状況やPSEへの影響を整理しています。