本記事では、世界モデルがロボティクスなどの分野におけるデータ不足を克服する手段として注目されている中、初期的なトレーニングインフラの問題点を指摘しています。Jasmineは、シングルホストから数百のアクセラレータにスケールできる高性能JAXベースの世界モデルコーディングベースで、最小限のコード変更で対応可能です。特に、CoinRunケーススタディの再現において、従来の実装に比べて桁違いの速さで結果を出すことができるよう、データロード、トレーニング、チェックポイントなどにおける最適化が実施されています。さらに、完全再現可能なトレーニングを保証し、多様なシャーディング構成をサポートしています。Jasmineを厳選された大規模データセットと組み合わせることで、モデルファミリーやアーキテクチャのベンチマーキングパイプラインが構築できる土台を提供します。