本記事では、実世界の表形式データセットにおけるプライバシーや規制の課題に対処するために設計された新しい生成フレームワークCA-GANを紹介します。CA-GANは、因果グラフの抽出と因果グラフに基づいた条件付きWGAN-GPによる二段階アプローチを採用し、因果関係を強化します。また、生成器はリアルデータと偽データから構築した因果グラフを一致させる強化学習に基づいた新たな目的で訓練され、訓練およびサンプリング段階での因果認識を確保しています。複数の表データセットにわたる評価において、CA-GANは因果維持、ユーティリティ維持、プライバシー維持の観点から最高性能を示しました。これにより、高品質でプライバシーに配慮した合成データセットの作成を求めるデータエンジニアに対し、実用的なソリューションを提供します。