arXiv cs.LG

PRIVET: 極値理論に基づくプライバシーメトリック

PRIVET: Privacy Metric Based on Extreme Value Theory

http://arxiv.org/abs/2510.24233v1


本記事では、深層生成モデルが遺伝子配列や健康データなどのセンシティブなデータに基づいて訓練される際のプライバシー問題について議論しています。特に、オーバーフィッティングと関連したプライバシー漏洩に注目し、これを評価するための新たな手法「PRIVET」を提案しています。PRIVETは、サンプルレベルでのプライバシーリスクを定量化するために、近傍距離の極値統計を使用し、各合成サンプルに個別のプライバシー漏洩スコアを割り当てます。実験を通じて、高次元かつサンプルサイズが限られたデータ(例: 遺伝子データ)でも、PRIVETが記憶のインスタンスやプライバシー漏洩を信頼性高く検出できることを示しています。また、既存のアプローチとの比較を行い、定性的かつ定量的な出力を通じてデータセットレベルおよびサンプルレベルでの評価を提供する優位性を確認しています。