DEXTER: 視覚モデルのためのテキスト的推論による拡散誘導説明

DEXTERは、機械学習モデルの挙動を理解し説明するためのデータフリーのフレームワークです。この手法は、拡散モデルと大規模言語モデルを利用して、視覚分類器のためのグローバルなテキスト説明を生成します。DEXTERは、テキストプロンプトを最適化することで、特定の分類器を強く活性化させるクラス条件付き画像を合成します。合成されたサンプルを用いて、特定のクラスに関連する決定パターンやバイアスを詳述する自然言語のレポートを引き出します。従来の手法とは異なり、DEXTERはトレーニングデータや地面真実ラベルにアクセスすることなく、分類器の決定プロセスを自然言語で説明できます。このフレームワークは、活性化の最大化、スライス発見、バイアス説明といった3つのタスクでその柔軟性を示し、視覚分類器の内部メカニズムを明らかにします。実験結果により、DEXTERは既存の手法よりも優れたモデル説明性能とクラスレベルのバイアス報告の精度を示しました。