arXiv cs.LG

SynC: ガウシアンコピュラによる合成人口生成のための統一フレームワーク

SynC: A Unified Framework for Generating Synthetic Population with Gaussian Copula

http://arxiv.org/abs/1904.07998v2


SynCは、さまざまな社会経済および人口データセットを統合し、個々のレベルにまでダウンスケーリングするプロセスである合成人口生成のためのマルチステージフレームワークです。データから潜在的な外れ値を除去し、ガウシアンコピュラモデルを用いて依存関係と周辺分布を正しく捉えます。最後に、予測モデルを利用してデータセットを一つに統合し、周辺制約に合わせてスケーリングします。この記事では、集約データソースから個人レベルのデータを生成する新しいフレームワークの提案、特徴エンジニアリングツールとしての価値、実用的なフレームワーク実装の提供、そして生産レベルでのスケーラビリティを確保することを主な貢献として挙げています。