arXiv cs.LG

分散メモリリトリーバルによるマルチエージェントの文脈内協調

Multi-agent In-context Coordination via Decentralized Memory Retrieval

http://arxiv.org/abs/2511.10030v1


本記事では、分散メモリリトリーバルを用いたマルチエージェントの文脈内協調(MAICC)という新しいアプローチを提案しています。この手法は、大規模なトランスフォーマモデルが多様なデータセットに基づいてトレーニングされ、パラメータ更新を必要とせずに未見のタスクに対して優れた数ショット性能を示すことに触発されています。特に、協調的なマルチエージェント強化学習(MARL)において、エージェントが共通の目標に向かって調整する必要があるため、分散ポリシーの展開がタスクの整合性や報酬配分において不整合を引き起こすという課題があります。MAICCは、中央集権的な埋め込みモデルを用い、エージェントが現在のサブ軌道と組み合わせたコンテキスト情報から意思決定を行うことを可能にします。また、実行中に新しいメモリメカニズムを導入し、エージェント間の正しいクレジット割り当てを保証するハイブリッドユーティリティスコアを提案しています。実験結果は、MAICCが未見のタスクへの適応を従来の手法よりも迅速に行えることを示しています。