GeoX-Benchは、大規模マルチモーダルモデル(LMM)のクロスビュー地理的ローカリゼーションとポーズ推定能力を評価するための包括的なベンチマークです。このベンチマークは、49か国の128都市にわたる10,859組のパノラマ衛星画像ペアと755,976の質問応答ペアを含んでいます。42,900ペアはベンチマーク用に特に指定されており、残りはLMMの能力を向上させるために使用されます。現在のLMMは地理的ローカリゼーションタスクで優れた性能を示す一方で、ポーズ推定タスクでは効果が大幅に低下します。これにより、今後の改善が求められることが示されています。また、GeoX-Benchのトレーニングデータで指示調整を行うと、クロスビューの地理的感覚能力が大幅に向上する可能性があることが示されています。