LLM生成テキストの検出可能性について：LLM生成テキストとは何か？

大規模言語モデル（LLM）の普及に伴い、研究者たちはLLMによって生成されたテキストの検出に注目しています。しかし、「LLM生成テキスト」の定義は一貫しておらず、使用シナリオやLLMの多様性が検出の難しさを増しています。通常、検出対象とされるものはLLMが生成可能なテキストの一部に過ぎません。また、LLMの出力に人間が編集を加えることや、LLMがユーザーに与える微妙な影響により、LLM生成と人間書きのテキストの境界が曖昧になっています。既存のベンチマークや評価手法は、実際の検出器の適用条件を十分に考慮しておらず、その結果はしばしば誤解され、その意義は薄れています。そのため、検出器は特定の条件下では有用ですが、その結果は決定的な指標ではなく、参考程度に解釈されるべきです。