本稿では、テキスト分類モデルの頑健性を高めるために、自動生成された反事実データを用いる方法を提案しています。偽相関が統計的分類器の有効性を脅かすことは知られており、特に訓練データと同じ分布のテストデータでは高い精度を示すが、分布が変わると急速に精度が低下します。本研究では、因果特徴を特定し、それに基づいて元の訓練データから反事実サンプルを生成します。具体的には、因果特徴を反対の特徴に置き換え、そのサンプルに対して対照的なラベルを付与します。実験結果から、従来のモデルは人間生成の反事実サンプルに対して極めて低い精度を示す一方で、元データと反事実データを組み合わせて訓練したモデルは、より頑健で高い精度を維持できることが明らかになりました。