arXiv cs.AI

クラスベースの入力画像構成を使用した小規模かつ不均衡データセットにおける診断性能の向上

Improving Diagnostic Performance on Small and Imbalanced Datasets Using Class-Based Input Image Composition

http://arxiv.org/abs/2511.03891v1


深層学習モデルは、小規模かつ不均衡なデータセットでは高い誤予測率を示すことがあります。本研究では「クラスベースの画像構成」という新たなアプローチを提案し、同じクラスの複数の画像を融合させて合成視覚コンポジット、すなわちComposite Input Images(CoImg)を作成します。これにより、クラス内部の変動性が増し、訓練サンプルあたりの有用情報密度が向上し、微妙な疾患パターンの識別能力が高まります。この方法は、光干渉断層撮影データセット(OCTDL)を使用して評価され、元のデータセットと新たに作成したコアンサンプリングデータセット(Co-OCTDL)を比較しました。VGG16モデルを使用した結果、新しいアプローチは診断性能を著しく向上させ、正確度99.6%、F1スコア0.995、AUC 0.9996を達成しました。この方法は、不均衡またはサンプルサイズが小さいデータセットでも高品質な予測を生成できることを示しています。