arXiv cs.LG

イメージ分類器におけるClever Hans戦略の緩和:反例生成を通じて

Mitigating Clever Hans Strategies in Image Classifiers through Generating Counterexamples

http://arxiv.org/abs/2510.17524v1


この記事では、深層学習モデルが持つ脆弱性、特に「Clever Hans」予測子によって引き起こされる疑似相関の問題に焦点を当てています。従来の手法である深層特徴再重み付け(DFR)は、グループラベルを必要とし、さまざまな制約があります。これらの制約を克服するために、著者たちは「反事実的知識蒸留(CFKD)」という新しいフレームワークを提案します。この手法は、多様な反事実を生成し、モデルの判断境界を修正するために人間のアノテーターを活用します。CFKDは、データポイントを新たに追加し、サンプリング数の少ないグループを強化します。また、多数の疑似相関に対しても効果的であり、低データ条件下で特に優れた結果を示します。実験において、CFKDの有効性を5つのデータセットで示し、各選択肢の影響についてのアブレーション研究も行っています。