合成データが相関した複数インスタンス学習の一般化ギャップを明らかにする

Synthetic Data Reveals Generalization Gaps in Correlated Multiple Instance Learning

本研究では、医療画像解析における複数インスタンス学習（MIL）の課題に取り組みます。従来のMIL手法は、画像のパッチやスライスを別々に扱うため、近接するインスタンスの関係性を無視しがちであり、実際のアプリケーションにおいて重要な情報が欠落します。私たちは、隣接するインスタンス特徴を考慮しなければ正確な予測ができない合成分類タスクを設計しました。このタスクにおける最適なベイズ推定器と既存のMILアプローチの性能を比較すべく評価し、特に新しい相関MIL手法が数万のインスタンスから学習しても一般化が難しいことを実証します。研究は高解像度の画像解析の効果を高めるための新しい知見を提供します。