BERTは単一のテキスト拡散ステップに過ぎない

この記事では、BERTとテキスト生成の新たな手法である「拡散モデル」について探求しています。Google DeepMindが発表したGemini Diffusionは、ランダムノイズを段階的に精製してテキストを生成するもので、従来のGPTモデルとは異なります。著者は、この拡散プロセスを用いてBERT風のモデルをテキスト生成に応用できるのではないかと考え、概念実証を試みました。また、BERTは2018年に導入されたマスク言語モデリング（MLM）を基にしており、E-Encoderモデルは文脈を一度に理解するなど、特に文章全体を必要とするタスクに優れています。さらに、拡散モデルの基本的な考え方は、テキストにノイズを加えた後、それを段階的に回復するというもので、これにより新しい生成手法が見出される可能性があります。