超音波画像は、リアルタイムで放射線を使用しない診断手法として広く利用されていますが、画像の解釈はノイズが高く、オペレーターの技量に依存することから困難です。本記事では、超音波データのみに特化して事前学習された初の大規模自己教師型MAEフレームワークであるUSF-MAEを提案します。このモデルは、370,000枚の2Dおよび3Dの超音波画像を用いて訓練され、幅広い解剖学的領域をカバーしています。USF-MAEは、マスクされた画像パッチを再構築することで、ラベルなしデータから豊かな特定モダリティの表現を学習します。さらに、さまざまな公開ベンチマークデータセットで微調整を行った結果、従来のCNNやViTと比べて優れたパフォーマンスを発揮しました。特に、乳がん分類での超音波基盤モデルUltraSamに迫る性能を示し、他のタスクでも超えました。この成果は、特定の解剖学的領域間での一般化能力の強さを示しています。