この研究は、複雑な戦略が要求されるFPSゲームVALORANTにおいて、ラウンドの結果を予測するモデルを構築することを目的としています。従来の研究が試合ログデータや統計情報に基づいているのに対し、本研究ではマッチ映像内のミニマップ情報を分析し、ゲーム内でのキャラクター位置やその他のイベント情報など、詳細な戦術的特徴を取り入れることで予測精度を向上させることを試みています。TimeSformerという映像認識モデルに基づき、戦術イベントラベルで拡張されたデータセットで学習したモデルが約81%の予測精度を達成し、特にラウンドの中盤以降において優れた性能を示しています。この結果は、試合映像から得られる戦術的特徴を利用することがVALORANTのラウンド結果予測において非常に効果的であることを示唆しています。