大規模停電後の電力分配システム(PDS)の復旧には、電源供給と電圧制限、熱制約などの非線形制約のもとで、フィーダートポロジーを再構成し、分散型エネルギー資源(DER)を調整するための逐次的な切り替え操作が必要です。この研究では、異種エージェント強化学習(HARL)フレームワークに基づいて、異種エージェント近似ポリシー最適化(HAPPO)を適用し、相互接続されたマイクログリッド間での協調的な復旧を実現します。各エージェントは異なる負荷やDER容量を持つマイクログリッドを制御し、実際の構造的異質性を導入します。中央集権的な批評者を通じて分散型アクターポリシーをトレーニングし、安定したオンポリシー更新のためにアドバンテージ値を計算します。IEEEのシステムでの実験では、HAPPOがDQNやPPOなどの他の手法よりも速い収束、より多くの復旧電力、およびスムーズなマルチシードトレーニングを達成したことが示されています。これにより、HARLフレームワーク内でのマイクログリッドレベルの異質性の組み込みが、複雑なPDS復旧におけるスケーラブルで安定した解決策をもたらすことが確認されました。