arXiv cs.AI

タスク特化型シャープネス対応O-RANリソース管理のためのマルチエージェント強化学習

Task Specific Sharpness Aware O-RAN Resource Management using Multi Agent Reinforcement Learning

http://arxiv.org/abs/2511.15002v1


次世代ネットワークでは、オープン無線アクセスネットワーク(O-RAN)アーキテクチャを用いてダイナミックなリソース管理を実現しています。著者らは、深層強化学習(DRL)がネットワークリソースの最適化に有効である一方で、動的環境における堅牢性と汎用性に課題があることに着目しました。本論文では、複数のエージェントによる強化学習(MARL)フレームワークにおいて、ソフトアクター・クリティック(SAC)アルゴリズムをシャープネス・アウェア・ミニマイゼーション(SAM)で強化する新たなリソース管理手法を提案しています。この手法では、環境の複雑さに応じてエージェントごとに異なる正則化を行い、無駄なオーバーヘッドを削減し、トレーニングの安定性と汎用性を向上させることが可能です。また、エージェント間の探索と利用のトレードオフを洗練するための動的スケジューリングも取り入れています。実験結果は、本手法が従来のDRLアプローチよりも最大22%のリソース配分効率向上を実現していることを示しています。