arXiv cs.AI

状態分解可能MDPを用いた専門家の混合によるマルチタスク車両ルーティングソルバー

Multi-Task Vehicle Routing Solver via Mixture of Specialized Experts under State-Decomposable MDP

http://arxiv.org/abs/2510.21453v1


本研究では、マルチタスクの車両ルーティング問題(VRP)に対し、基盤となるVRPのバリエーションから派生する構造を活用し、専門化されたソルバーを再利用するフレームワークを提案します。これにより、統一されたソルバーがそれぞれの基盤VRPバリエーションに特化した利点を享受できるようになります。具体的には、状態空間を基盤VRPバリエーションに関連する基盤状態空間の直積として表現する状態分解可能MDP(SDMDP)を導入し、最適な基盤方針を自動的に生成します。さらに、最適基盤方針を学習する混合関数を取り入れた潜在空間ベースのSDMDP拡張も開発し、潜在空間での方針再利用を可能にします。これにより、Mixture-of-Specialized-Experts Solver(MoSES)を実現し、大規模な実験を通じて従来の手法に対して優位性を示しました。