本研究は、機械学習が医療画像に広く使用される中で、報告された改善が統計的に頑健でない問題に焦点を当てています。具体的には、少しの性能向上が偽陽性である可能性が高いことが指摘されていますが、これまでの分析では、同様の検証スコアを持つモデルが未見のデータに対して異なる挙動を示す可能性がある「未指定要因」を考慮していませんでした。本研究では、偽の優越性主張をモデル化する最近の統計フレームワークを拡張し、未指定要因を追加の変動要素として組み込みました。シミュレーションにより、わずかな初期値の変動(約1%)でも、優越性を支持するために必要な証拠が大幅に増加することが示されました。医療画像システムの検証においては、訓練の変動を明示的にモデル化する必要性が強調されています。