本研究では、対敵的ロバストマルチタスク適応線形二次制御の設定を検討します。この設定では、複数のシステムがモデル不確実性や対敵的な破壊から保護された状態で制御ポリシーを協力して学習します。著者たちは、クラスタリングとシステム同定を組み合わせたクラスタリングマルチタスクアプローチを提案し、破損したモデル更新を緩和するための堅牢な集約手法を導入しています。分析により、クラスタリングの精度、クラスタ内の異質性、および対敵的行動が、LQRタスクにおける確実性等価(CE)制御の期待される後悔に与える影響を特定しています。さらに、正直なシステムの数が各クラスタ内で増えるほど、後悔が逆数的に減少し、この減少が対敵的なシステムの限定的な割合の下でも維持されることを示す非漸近的境界を確立しています。