arXiv cs.LG

協調的公共資源配分のためのゲーム理論に基づく時空間強化学習フレームワーク

A Game-Theoretic Spatio-Temporal Reinforcement Learning Framework for Collaborative Public Resource Allocation

http://arxiv.org/abs/2510.26184v1


公共資源の配分は、都市インフラ、エネルギー、交通などの資源を効率的に配分し、社会的要求を満たすことを目的としています。しかし、既存の手法は個々の資源の移動を独立して最適化することに焦点を当てており、容量制約を考慮していません。この問題に対処するために、著者らは協調的公共資源配分(CPRA)という新たな問題を提案し、これに時空間のダイナミクスと容量制約を明示的に組み込んでいます。解決のために提案されたフレームワークは「ゲーム理論に基づく時空間強化学習(GSTRL)」です。このフレームワークはCPRA問題を潜在ゲームとして定式化し、ナッシュ均衡の近似を理論的に確立します。GSTRLは現実のデータセットで評価され、優れたパフォーマンスが示されました。