本記事では、RacketVisionという新しいデータセットとベンチマークを紹介します。これは、卓球、テニス、バドミントンを対象にしたスポーツ解析のためのコンピュータビジョンの進展を目的としています。このデータセットは、ラケットのポーズとボールの位置に対する詳細なアノテーションを提供する初のものであり、人間と物体間の複雑な相互作用の研究に貢献します。具体的には、精緻なボールトラッキング、ラケットポーズの推定、ボール軌道の予測という3つの関連タスクに取り組んでいます。従来の基準を検証した結果、ラケットポーズの特徴を単純に連結するだけではパフォーマンスが低下することが判明しましたが、CrossAttentionメカニズムを導入することで、その価値が発揮され、強力な単一モーダル基準を上回る軌道予測結果を得ることができました。RacketVisionは、動的オブジェクトトラッキング、条件付きモーション予測、多モーダル分析における今後の研究のための多用途なリソースを提供します。