この記事では、知能チュータリングシステム(ITS)が学生の特性に基づいて教育を個別化できる一方で、各学生がユニークであること、また学習過程が部分的にしか観測できないことの難しさについて論じています。著者らは、教師と学生の介入を含む教室環境をシミュレートするための動的な時系列環境を開発しました。介入の種類にはチュータリング、講義、試験が含まれ、情報収集のために介入のレベルを調整できるように設計されています。その後、個別学生の状態を学習しながら集団情報を活用する強化学習ITSを開発。介入の頻度が学生に与える影響や、隠れた情報が増えることで問題が難しくなる点についても強調しています。また、強化学習とグリーディなルールに基づくヒューリスティックアプローチの効果を比較し、異なるアプローチでも類似の結果を得られることを示しました。特に、非介入政策下でのコース構造のテストにおいて、追加情報の利用がクイズや中間試験の成績向上に寄与することが分かりました。