サプライチェーンにおけるマルチプロダクト・マルチノード在庫管理のための強化学習

Reinforcement Learning for Multi-Product Multi-Node Inventory Management in Supply Chains

この記事では、サプライチェーンにおけるマルチプロダクト在庫管理に強化学習（RL）を適用する方法について説明しています。具体的には、50から1000の製品を共有容量で同時に管理するという新しい課題を扱っています。この課題は、3つの店舗に供給する倉庫を含むマルチノードのサプライチェーンに焦点を当て、倉庫や店舗、輸送の各部門には限られた容量があることを考慮しています。また、補充タイミングが異なり、需要が不確実である点も強調されています。著者たちは、新たなマルチエージェント強化学習モデルを提案し、A2Cアルゴリズムを用いて最適な意思決定を行い、製品の売上最大化と廃棄物最小化という複数の目的を同時に達成する実験結果を示しています。