arXiv cs.LG

高次元における差分プライバシーPCAの漸近性

High-Dimensional Asymptotics of Differentially Private PCA

http://arxiv.org/abs/2511.07270v1


本論文では、差分プライバシーの観点から主成分分析(PCA)におけるプライバシーと効用の特性を高次元で探ります。Sensitive datasetの統計情報をプライバシー確保のためにランダムノイズで隠す手法を用いるが、必要以上のノイズを加えると有意義な信号が失われるとの問題提起から始まります。本研究は、目標とするプライバシーレベルを達成するために必要な最小のノイズレベルを特定することを目指します。具体的には、高次元データの主成分をプライベート化する際の最適なノイズレベルを高次元極限($p ightarrow extinfty$)で解析しました。また、プライバシー分析には仮説検定の視点を取り入れ、プライバシー保証の鋭いキャラクタリゼーションを提供することに成功しました。最終的に、特定個人の検出がどれほど困難かを定量的に示しています。