本論文では、確率的リクエストを伴う協調型マルチビークルダイナミックピックアップ・デリバリー問題(MVDPDPSR)に取り組み、系列対系列に基づくエンドツーエンドの集中型意思決定フレームワーク「マルチエージェントポインタートランスフォーマー(MAPT)」を提案しています。このMVDPDPSRは、車両ルーティング問題の拡張であり、特にオンデマンド配信などのシナリオで広く応用されています。従来のオペレーションリサーチ手法は、大規模な動的問題に対して計算の複雑性や時間効率において瓶頸に直面しています。既存の強化学習手法は一定の進展を見せているものの、独立したデコーディングやエンティティ間の関係を捉えるネットワークの課題など、いくつかの問題に直面しています。そこで、MAPTはトランスフォーマーエンコーダを用いてエンティティの表現を抽出し、ポインターネットワークとトランスフォーマーデコーダを組み合わせて共同動作シーケンスを自回帰的に生成します。また、関係認識アテンションモジュールを導入し、相互の関係性を捕捉します。実験結果は、MAPTがパフォーマンスにおいて既存のベースライン手法を大幅に上回り、従来の方法に対して計算時間の優位性を示すことを確認しています。