arXiv cs.AI

アトリビューションからアクションへ:予測と説明を共同でALIGNする

From Attribution to Action: Jointly ALIGNing Predictions and Explanations

http://arxiv.org/abs/2511.06944v1


この記事では、モデルの予測と解釈可能な推論を整合させることに成功している説明指導学習(EGL)の可能性について説明されていますが、従来の手法が外部のアノテーションやヒューリスティックに依存しているため、質の低い監視信号がモデルの性能を悪化させることがあると指摘されています。そこで、著者らは新しいフレームワークALIGNを提案し、分類器とマスカーを共同で訓練する方法を示しました。マスカーは情報のある領域を強調するマスクを生成し、分類器は予測精度とマスクのサリエンシーマップとの整合性を最適化します。実験により、ALIGNは2つの一般化ベンチマークで強いベースラインを上回り、説明の質でも優れていることが示されています。