Ettin Suiteは、エンコーダーとデコーダーのペアモデルを用いた最新の手法を紹介しています。このスイートでは、エンコーダー専用ModernBERTモデルに対抗する形で、デコーダー専用モデルも同様のデータセットと学習手法で訓練されています。これにより、両モデルの比較が可能となり、それぞれのアーキテクチャの強みが浮き彫りになることで、最先端のパフォーマンスが得られます。また、エンコーダーとデコーダーが異なる訓練目標を持つ中での競争力の比較、場合によっては逆転する可能性も探ります。訓練プロセスは三段階に分かれており、フェーズ1では基礎的な知識の構築、フェーズ2でより長いコンテキストの理解、フェーズ3でプレミアムデータの使用を行い、パフォーマンスを最大化することを目指しています。