arXiv cs.LG

医療因果推論における合成データの生成と評価の改善

Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference

http://arxiv.org/abs/2510.18768v1


医療介入の開発と評価に欠かせない因果推論は、規制の壁によって実世界の医療データセットにアクセスすることが困難です。これにより、合成データは医療分析を可能にする貴重な資産となります。しかし、既存の生成モデルは、特に治療に焦点を当てた因果推論タスクが持つ独自の課題を考慮していません。著者たちは、合成データが最大の有用性を持つために満たすべき要件を特定し、その要件に基づいた評価指標を提案しています。さらに、治療効果分析のための合成データを生成する新しい手法「STEAM」を紹介し、これにより既存のモデルと比較して優れた性能を示しています。STEAMは、治療を含むデータ生成プロセスを模倣し、設定した要件を最適化することで、データの複雑さが増すほどその効果を発揮します。