この記事では、火星科学における基盤モデルの評価のための新しいベンチマーク「Mars-Bench」を紹介しています。著者たちは、火星科学の分野が他の領域と比較して標準化された評価基準を欠いていることに着目し、これが火星タスクにおける基盤モデルの発展を制限していると指摘します。Mars-Benchは、分類、セグメンテーション、物体検出を含む20のデータセットから構成されており、クレーターや礫、氷といった重要な地質特徴に焦点を当てています。自然画像や地球の衛星データ、最新の視覚言語モデルで事前訓練されたモデルを使用した標準化されたデータセットとベースライン評価を提供します。分析の結果、火星特有の基盤モデルは一般的なモデルよりも利点がある可能性があることが示され、ドメイン適応された事前訓練のさらなる探求が促されています。