BadGraph: テキスト指向グラフ生成のための潜在拡散モデルに対するバックドア攻撃

BadGraph: A Backdoor Attack Against Latent Diffusion Model for Text-Guided Graph Generation

この記事では、テキスト指向グラフ生成における潜在拡散モデルに対するバックドア攻撃手法「BadGraph」を提案しています。従来の研究では画像や無条件グラフ生成におけるバックドア攻撃が扱われてきましたが、条件付き、特にテキストをガイドとするグラフ生成はほとんど検証されていませんでした。BadGraphは、テキストトリガを利用してトレーニングデータを汚染し、攻撃者が指定したサブグラフを推論中に誘発させるバックドアを隠密に植え付けることができます。実験により、汚染率が10%未満でも50%の攻撃成功率が得られ、24%で80%以上の成功率を実現できることが示されました。さらに、これにより薬剤発見などのモデル応用におけるセキュリティリスクが浮き彫りになり、バックドア攻撃に対する堅牢な防御の必要性が強調されています。