arXiv cs.LG

量子グラフアテンションネットワークを利用した車両ルーティング問題の深層強化学習

Vehicle Routing Problems via Quantum Graph Attention Network Deep Reinforcement Learning

http://arxiv.org/abs/2511.15175v1


車両ルーティング問題(VRP)は、物流および流通の広範な応用があるNP困難なタスクである。この記事では、深層強化学習(DRL)とグラフニューラルネットワーク(GNN)を組み合わせた手法を提案する。特に、従来の多層パーセプトロン(MLP)をパラメータ化量子回路(PQC)に置き換えた量子グラフアテンションネットワーク(Q-GAT)を用い、パラメータ数を50%以上削減しつつ、グラフアテンションエンコーダーの表現力を維持する。結果、提案手法は、従来の手法に比べて収束が早く、ルーティングコストが約5%削減されることが示された。これにより、PQCsが大型便のルーティングと物流最適化のコンパクトで効果的な解法としての可能性を持つことが証明された。実験は、プロキシマルポリシー最適化(PPO)を用いたものである。