この記事では、長距離依存性を持つマルチエージェント強化学習(MARL)の新しいアプローチであるSTACCA(Shared Transformer Actor-Critic with Counterfactual Advantage)を提案しています。従来の方法は、局所エージェントの相互作用の減衰特性に頼ることが多く、帯域障害や流行病の広がりをキャプチャする能力が制限されていました。また、既存の手法は異なるネットワークトポロジーに対する一般化も欠けており、新しいグラフへの適用時には再学習が必要です。STACCAは中央集権的なグラフトランスフォーマーを使用して長距離依存性をモデル化し、システム全体のフィードバックを提供します。これにより、ネットワークの制御タスクにおいて向上したパフォーマンスと一般化能力を示し、広範囲なネットワークシステムにおけるスケーラブルで一般化可能な制御の実現可能性を強調しています。