視覚マムバを用いたPET-CT肺腫瘍セグメンテーションのための文脈ゲート付きクロスモーダル知覚

Context-Gated Cross-Modal Perception with Visual Mamba for PET-CT Lung Tumor Segmentation

本研究では、肺腫瘍の正確なセグメンテーションが診断や治療計画の向上に不可欠であることを踏まえ、PETとCTスキャン画像を統合する軽量マルチモーダルフレームワーク「vMambaX」を提案しています。このフレームワークは、文脈ゲート付きクロスモーダル知覚モジュール(CGM)を使用し、モダリティ間の特徴の相互作用を適応的に強化し、有益な領域を強調しつつノイズを抑制します。PCLT20Kデータセットで評価した結果、モデルは従来のベースラインモデルを上回りながら、計算の複雑性を低く保つことができました。これにより、マルチモーダル腫瘍セグメンテーションにおける適応的クロスモーダルゲーティングの効果が確認され、vMambaXが効率的かつスケーラブルな肺癌分析のためのフレームワークとしての可能性が示されています。