本論文では、マスク拡散モデル(MDM)に関する新しい生成モデルが提案されています。従来のオート回帰モデル(ARM)に比べ、条件付き独立近似を活用することで計算コストを削減する一方で、サンプリング分布に若干のバイアスが生じることが指摘されています。著者たちは、この計算と精度のトレードオフを調査し、生成されるトークンの平均数に依存する一般的な誤差境界を示しました。さらに、非定数スケジュールサイズの効果を考察し、データ分布の情報プロファイルに基づいた最適スケジュールを特定しました。この結果により、スケジュールサイズの最適化が原則に基づいて行えるようになります。