本記事では、異質な敵対的プレイ(HAP)という新しい敵対的自動カリキュラム学習フレームワークが提案されています。このフレームワークは、教師と生徒の相互作用を最小最大最適化としてモデル化し、タスクを生成する指導者と問題を解決する学習者が敵対的なダイナミクスを通じて共進化します。従来の自己学習フレームワークは対称的なゼロサム競争に基づいていますが、HAPは非対称性を取り入れ、リアルタイムの学習者のパフォーマンス指標に応じてタスクの複雑さを調整する双方向フィードバックシステムを採用しています。多タスク学習の実験によって、このフレームワークが最先端の基準と同等のパフォーマンスを達成し、人工エージェントおよび人間の被験者において学習効果を高めるカリキュラムを生成することが示されています。