本論文では、フライト遅延予測の研究を進め、タブularデータ向けの基盤モデルの開発を支援するために設計された大規模なマルチモーダルフライト遅延データセット「Aeolus」を紹介します。既存のデータセットは通常、平坦なタブular構造に制約されており、遅延拡散に内在する時空間ダイナミクスを捉えるのに失敗しています。Aeolusは、50万フライト以上の運用、気象、空港レベルの特徴を含むタブularデータセット、遅延の拡散をモデル化するフライトチェインモジュール、共有機体、乗員、空港資源の接続をエンコードしたフライトネットワークグラフという3つのモダリティを提供することで、この制限を克服しています。データセットは、現実的かつ再現可能な機械学習評価を支えるために、時間的スプリット、包括的な特徴、厳格な漏洩防止に基づいて慎重に構成されています。Aeolusは、回帰、分類、時間構造モデリング、グラフ学習など、広範なタスクをサポートし、タブular、逐次、グラフモダリティにまたがる統一ベンチマークとして機能します。