arXiv cs.AI

Earth AI: 基礎モデルとクロスモーダル推論による地理空間インサイトの解放

Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning

http://arxiv.org/abs/2510.18318v1


地理空間データは、地球の理解において膨大な潜在能力を提供しますが、そのデータの量と多様性、解像度や時間スケール、スパース性が分析や解釈の上で大きな課題となっています。本論文では、Earth AIと呼ばれる地理空間AIモデルとエージェント的推論のファミリーを紹介し、新たな洞察を引き出す能力の向上について述べています。このアプローチは、惑星規模の画像、人口、環境の3つの主要領域にわたる基礎モデルと、インテリジェントなGemini駆動の推論エンジンに基づいています。厳密なベンチマークを通じて、基礎モデルの力と新しい能力を示し、これらを組み合わせることで相互補完的な価値を提供し、優れた予測能力を引き出すことを確認しました。複雑な多段階クエリに対応するために、私たちはGemini駆動のエージェントを開発し、複数の基礎モデルとともに大規模な地理空間データソースやツールを総合的に推論させました。新たな現実的危機シナリオのベンチマークで、このエージェントは生の地理空間データと実用的な理解とのギャップを埋めるための重要でタイムリーな洞察を提供する能力を示しました。