Anomagicは、例示的な異常を必要とせず、意味的に一貫性のある異常を生成するゼロショット異常生成手法です。視覚的およびテキスト的な手がかりをクロスマルチモーダルなプロンプトエンコーディングスキームで統一することで、Anomagicは豊富な文脈情報を活用し、インペインティングベースの生成パイプラインを誘導します。生成された異常とそのマスクとの正確な整合性を強化するために、対比的な精練戦略が採用されています。訓練を容易にするために、AnomVerseという12,987の異常マスクキャプション三重項のコレクションが導入されており、これは13の公開データセットから組み立てられ、キャプションは構造化された視覚プロンプトとテンプレートベースのテキストヒントを用いてマルチモーダル大規模言語モデルによって自動生成されています。広範な実験により、Anomagicは従来の手法よりも現実的で多様な異常を合成でき、下流の異常検出精度が大幅に向上することが示されています。また、Anomagicはユーザー定義のプロンプトを使用して、任意の正常カテゴリの画像に対して異常を生成できるため、異常生成のための多様な基盤モデルを確立しています。