arXiv cs.LG

採用における因果的合成データ生成

Causal Synthetic Data Generation in Recruitment

http://arxiv.org/abs/2511.16204v1


採用の分野では、個人情報の敏感さから公開されているデータセットが不足しており、データ品質が悪いことが問題視されています。特に、機械学習モデルや推薦アルゴリズムの開発には、豊富なデータが必要です。最近の因果生成モデル(CGM)の進歩により、データの因果関係を保持した合成データセットを生成し、公平性や解釈性を高めることが可能になりました。本研究では、雇用情報と履歴書をモデル化する二つのCGMを用いた合成データ生成手法を提案し、特定のバイアスを導入したシナリオにおける候補者ランキングの公平性を評価します。