本研究では、機械学習におけるラベルの主観性に着目し、通常の手法が多様な人間の判断を単一のラベルに集約することが、実際には誤った自信をモデルに強いる可能性があることを指摘しています。特に、曖昧なデータに対しては、ラベルの分布自体を真実と見なすべきだと主張し、ソフトラベル学習を用いることで認識的不確実性を保持できることを示しています。実験により、ビジョンおよび自然言語処理のタスクで、ソフトラベル学習は人間のアノテーションとのKLダイバージェンスを32%低下させ、モデルとアノテーションエントロピー間の相関を61%強化しました。また、ハードラベル学習と同等の精度を維持しつつ、ラベルの分布を測定可能な信号として扱う重要性も強調されています。