本研究は、複数の自律エージェントの協調が求められる現実の問題に対処するものです。特に、自己利益を追求するエージェントが、共有の報酬を持たず、多様なコミュニケーション戦略を学ぶモデルを紹介します。従来のアプローチでは、エージェントは個別の学習システムとして扱われ、単一の可微分コミュニケーションチャネルが存在しないため、エージェント間のコミュニケーション戦略を学ぶことができませんでした。本研究では、このギャップを埋めるため、自己利益のある目標を持つエージェントが共通の可微分コミュニケーションチャネルを用いることを前提とした学習アルゴリズムを開発しました。エージェントは、競合するコミュニケーションを自然に発生させ、それによって協力的なチームを上回る性能を示すことができることを実験で確認しています。