arXiv cs.AI

医療動作評価のための多変量ガウス表現学習

Multivariate Gaussian Representation Learning for Medical Action Evaluation

http://arxiv.org/abs/2511.10060v1


医療分野における繊細な動作評価は、包括的なデータセットの欠如、厳格な精度要件、迅速な動作の時空間ダイナミクスの不十分なモデル化といった独自の課題に直面しています。本記事では、6,372本の専門家によって注釈された動画から構成される、22の臨床ラベルを持つマルチビュー・マルチラベルの医療動作ベンチマーク「CPREval-6k」を導入し、医療運動解析を進めるための「GaussMedAct」という多変量ガウスエンコーディングフレームワークを提案します。このフレームワークは、共同動作を時間スケールを持つ多次元空間に投影し、動作を適応的な3Dガウスに分解します。このトークンは、異方性共分散モデルにより動作の意味を保持し、時空間ノイズに対して頑健です。提案手法は、ベンチマークにおいて92.1%のTop-1精度を達成し、リアルタイム推論でST-GCNベースラインを5.9%上回る成果を上げました。