HackerNews

なぜAIモデルはこれほど多くのエムダッシュを使用するのか?

Why do AI models use so many em-dashes?

https://www.seangoedecke.com/em-dashes/


AIによる文章生成の特徴としてエムダッシュの多用が挙げられますが、その理由は明確ではありません。この記事では、AIモデルがエムダッシュを多く使用する理由についていくつかの説明が検討されています。一つは、訓練データにエムダッシュが豊富に含まれているためとの見解ですが、実際には多くの人がAIのエムダッシュの多用を認識しているため、納得しにくいと指摘されています。また、エムダッシュが多機能であるため、次のトークンを予測する際に選択肢を広げるヒントになるという考え方もありますが、他の句読点も同様の柔軟性があります。さらに、アフリカの英語の方言や文化がエムダッシュの使用に影響を与えている可能性があるとされていますが、実際のデータではその使用頻度は低く、明確なつながりは見出せません。最終的に、AIモデルがエムダッシュを多用する理由は、今のところ十分に説明されていないことが強調されています。