本論文では、動的なワイヤレスネットワークにおける学習のための新しいフレームワークである「デュアルマインドワールドモデル」が提案されています。従来の強化学習(RL)手法は、データ効率が低く、長期的な計画が必要な複雑なネットワークには適応しにくいという問題がありました。提案されたモデルは、認知心理学に着想を得て、パターン中心のSystem 1と論理中心のSystem 2を融合させ、ネットワークのダイナミクスと論理を学習し、長期的なリンクスケジューリングを提供します。このモデルは、環境からの実データに依存せず、想像された経路を通じてリンクスケジューリングを最適化します。リアルなシミュレーターを用いた実験では、提案モデルはデータ効率を大幅に向上させ、未知の環境への適応力も強化されることが示されています。