arXiv cs.AI

TiS-TSL: 時間切替教師-学生学習による画像-ラベル監視された外科ビデオのステレオマッチング

TiS-TSL: Image-Label Supervised Surgical Video Stereo Matching via Time-Switchable Teacher-Student Learning

http://arxiv.org/abs/2511.06817v1


本研究では、最小侵襲手術(MIS)におけるステレオマッチングのための新しいフレームワーク、TiS-TSLを提案します。従来の教師-学生学習(TSL)は、限られた画像レベルのラベルを用いて疑似ラベルを生成するものでしたが、時間的整合性に欠け、動画フレーム間での不安定な予測を招いていました。TiS-TSLは、画像予測(IP)、前方動画予測(FVP)、後方動画予測(BVP)の三つのモードを持つ統一モデルを基にしており、時間的モデリングを柔軟に行います。このモデルは、画像から動画(I2V)での知識移転と、動画間の一貫性を比較する動画から動画(V2V)での精緻化を含む二段階の学習戦略を採用しています。実験では、TiS-TSLが他の手法を上回る性能を示し、逐次的な整合性を確保することで、安定したステレオマッチングを実現しました。