arXiv cs.AI

リヤプノフを考慮した量子インスパイア強化学習による連続時間車両制御:実現可能性研究

Lyapunov-Aware Quantum-Inspired Reinforcement Learning for Continuous-Time Vehicle Control: A Feasibility Study

http://arxiv.org/abs/2510.18852v1


本論文では、リヤプノフ安定性分析と量子ポリシー最適化を統合した新しいリヤプノフベースの量子強化学習フレームワーク(LQRL)を提案しています。このアプローチは、変分量子回路(VQC)の表現力と安定性を考慮したポリシー勾配メカニズムを組み合わせて、動的環境下での漸近的収束と安全な意思決定を実現します。車両の長手方向制御問題は、連続状態強化学習タスクとして定式化され、量子ポリシーネットワークがリヤプノフの安定性制約に従って制御アクションを生成します。シミュレーション実験では、安定性フィードバックのもとで訓練された量子インスパイアポリシーを用いた適応クルーズコントロールシナリオが実施され、その結果、LQRLフレームワークが量子ポリシー学習にリヤプノフ安定性を組み込むことに成功し、解釈可能で安定性に配慮した制御性能を実現できることが示されました。暫定的なオーバーシュートやリヤプノフ発散が観察されたものの、システムは制約された状態の進化を維持し、量子強化学習アーキテクチャに安全保障を統合する実現可能性が確認されました。このフレームワークは、自律システムやハイブリッド量子古典最適化領域における安全性が保証された量子制御への基盤となるステップを提供します。