本論文では、画像領域におけるポストホック説明可能性を持つ人工知能(XAI)に対する新しいブラックボックスモデル非依存の対抗攻撃手法であるeXIAAを提案しています。この攻撃の目的は、元の説明を変更しながらも、人間の目には検出されず、同じ予測クラスを維持することです。従来の手法とは異なり、モデルやその重みへのアクセスを必要とせず、モデルが算出した予測と説明のみに依存します。この攻撃は1ステップで行われ、提供される説明を大幅に変更することが可能であることが実証されています。また、ポストホック説明可能性手法によって生成された説明に基づいて、ResNet-18およびViT-B16の事前トレーニングモデルに対して攻撃を体系的に生成しています。結果として、予測確率を変えずに大きく異なる説明を生じさせることが示されています。