本論文では、時間に応じた視覚環境の進化に適応するAIシステムの必要性に応え、車両モデルの時間的進化を捉えたCaMiT(Car Models in Time)というデータセットを紹介しています。このデータセットは、190種類の車両モデル(2007-2023年)の787,000件のラベル付きサンプルと、5.1百万件のラベルなしサンプル(2005-2023年)を含んでおり、監視学習と自己監督学習の両方をサポートします。静的プレトレーニングにより、リソース効率を保ちながらも競争力のあるパフォーマンスが得られますが、年ごとのテストで精度が低下することが示されています。これに対処するために、段階的な分類設定を提案し、テンプラルロバストネスを向上させるための2つの戦略(バックボーンの更新と最終層の更新)を評価しています。また、トレーニング時に時間的メタデータを活用した画像生成手法も探索しており、よりリアルな出力を実現しています。CaMiTは、視覚認識と生成における時間的適応の研究に適した豊富なベンチマークを提供します。