本研究では、中央集権的なトレーニングと分散型の実行の下で、協力的な時間目標に対するマルチタスク・マルチエージェントポリシーの学習問題に焦点を当てています。タスクをオートマトンで表現することにより、複雑なタスクをエージェントに割り当てられる単純なサブタスクに分解することが可能になります。しかし、既存のアプローチはサンプル効率が低く、単一タスクのケースに限定されています。本研究では、タスク条件付き分散型チームポリシーの学習のための「オートマトン条件付き協調マルチエージェント強化学習(ACC-MARL)」フレームワークを提案し、実用性への主な課題を特定し、その解決策を提案します。さらに、学習されたポリシーの価値関数を使用して、テスト時に最適にタスクを割り当てる方法を示します。実験結果は、エージェント間のタスク認識に基づく多段階の協調行動を示しています。