進化的マルチタスク(EMT)アルゴリズムは、マルチタスク最適化における収束と最適性を確保するために、知識転送のための特化された設計が必要です。本論文では、強化学習を通じて系統的かつ一般化可能な知識転送政策を設計することを探求しています。我々は、転送するタスクを決定する「どこ」、転送する知識を決定する「何」、転送のメカニズムを決定する「どのように」という三つの主要な課題を特定しました。これに対処するために、三つのポリシーネットワークが特化したエージェントとして機能するマルチロールRLシステムを構築しました。このシステムは、タスクルーティング、知識管理、戦略適応を担当するエージェントで構成され、さまざまなタスク分配における優れた成果を示しています。さらなる分析を通じて、提案の合理性やシステムの学習内容に関する洞察も提供されています。