本稿では、イベントカメラを用いた深度推定のための大規模なデータセット「EvtSlowTV」を紹介します。イベントカメラは高動的範囲(HDR)と低遅延を持ち、困難な環境下でも信頼性のある深度推定が可能ですが、従来の手法は小規模な注釈データセットに依存しており、現実世界での一般化能力が制限されていました。EvtSlowTVは、YouTubeから収集した13億回以上のイベントを含むデータセットで、季節のハイキング、飛行、風景ドライブ、水中探査などの多様な環境条件と動きが含まれています。これにより、自由で自然な条件下でのイベントベースの深度学習が可能となり、フレームベースの注釈の必要を排除し、イベントデータの非同期性を保持します。トレーニングの結果、複雑なシーンや動きに対するモデルの一般化能力が向上することが示されています。