arXiv cs.LG

空間的超感知なしでの空間的超感知の解決

Solving Spatial Supersensing Without Spatial Supersensing

http://arxiv.org/abs/2511.16655v1


本稿では、Cambrian-Sの進歩を含む2つのベンチマーク(VSI-Super-RecallおよびVSI-Super-Counting)と、それぞれに特化した予測センシング推論戦略を紹介しています。特に、単純なベースラインであるNoSenseモデルを用いることで、VSI-Super-Recallを95%の精度で解決できることを示しました。これは、空間認知やワールドモデルを使わなくてもベンチマークがほぼ解決可能であることを示唆しています。また、Cambrian-Sが提案する推論方法がベンチマークにおけるショートカットを利用している可能性があることも考察しました。具体的には、VSI-Super-Countingの簡単な検証テストで、同じビデオを複数回繰り返すと、精度が42%から0%に崩壊することを示しています。これらの結果は、現在のベンチマークが空間的超感知を測定するにあたり信頼性がないことを示唆しています。最終的に、Cambrian-Sによる適応的な推論レシピが、堅牢な空間的超感知からではなく、ショートカットを利用してパフォーマンスが向上している可能性があることが示されました。