医療画像のためのマルチタスク・マルチモーダル自己教師あり学習

この論文は、医療画像分析における重要な課題、すなわち専門家による注釈が必要な広範なラベル付けデータセットに依存する問題に取り組んでいます。著者は、自己教師あり学習技術とドメイン適応法の開発を通じて、この制約を回避し、医療画像における深層学習の有用性と効果を高める新しいアプローチを提案しています。中心となるのは、マルチタスク学習と深層ドメイン適応向けに設計された新しい神経ネットワークアーキテクチャ「Medformer」です。このモデルは、様々なサイズやモダリティの医療画像データセットで効率的に事前学習を行い、動的な入力・出力適応メカニズムを備えています。また、未ラベルデータから意味のある情報を抽出する新しいプレテキストタスクを導入しており、実験を通じてモデルの有効性が検証されています。この研究は、ラベルデータへの依存を軽減し、医療分野での精度の高い診断ツールの実現に貢献するものです。