最近の深層学習の進展により、時系列予測の迅速な進歩が見られるものの、多くの最先端モデルは実世界での適用において安定したパフォーマンスを発揮できずにいます。この問題の一因は、深層学習アーキテクチャのブラックボックス性や、現在の評価フレームワークの限界です。これにより、モデルの特定の強みや弱点を明確に定量的に評価することが難しくなり、適切なモデルの選定が複雑化しています。これを解決するために、著者たちは合成データ駆動型評価パラダイム「SynTSBench」を提案します。このフレームワークは、時間系列予測モデルの基本的なモデリング能力を系統的に評価し、時間的特徴の分解や異常回復能力の分析など、3つのコア分析次元を利用します。実験結果は、現在の深層学習モデルがすべてのタイプの時間的パターンに対して最適な基準に達していないことを示しています。