本研究は、データの悪用や偽造のリスクが高まる中で、タイムシリーズ大規模モデル(TSLM)によって生成された合成時系列データの識別問題を探求しています。テキストデータの検出に関する研究はいくつか存在するものの、時系列データはその情報密度が低く、確率分布が滑らかであるため、従来のトークンベースの検出器が適用できないことが分かりました。研究者たちは、実際の時系列とモデル生成時系列の間にある微妙な分布の違いを考察し、「不確実性収束仮説」を提唱します。この仮説によれば、モデル生成時系列は、再帰的予測の下で不確実性が減少していくことが示されます。この仮説を理論的に証明し、さまざまなデータセットに対して経験的に検証した結果、提案された「不確実性収束推定器」(UCE)が、従来の最先端手法を上回る検出性能を持つことが確認されました。