Antislopは、言語モデルにおける特有の繰り返し表現「スロップ」を特定し排除するための包括的なフレームワークです。スロップは、AIが生成するテキストの品質を低下させ、すぐに識別可能となります。Antislopは、三つの革新技術を組み合わせています。まず、バックトラッキングを用いて推論時に不要な文字列を抑制するAntislopサンプラー、次にモデル特有のスロップを人間の基準と比較してトレーニングデータを生成する自動化パイプライン、そして、禁止パターンが現れた場合に個々のトークンを調整する新しいファインチューニング手法である最終トークン優先最適化(FTPO)です。これにより、スロップパターンが人間のテキストよりも1000倍以上頻繁に現れることが示されました。Antislopは8,000以上のパターンを抑制しながら品質を保ち、FTPOは90%のスロップ削減を実現します。全てのコードと結果はMITライセンスのもとで公開されています。