DANIELは、電子健康記録(EHR)の大規模バイナリデータからプライバシーを保護しながらスケーラブルな表現学習を可能にする分散型フレームワークを提案しています。高次元、データソースの異質性、および厳しいデータ共有制約で特徴付けられる現代のデータ環境に対応する方法です。この研究では、マルコフ確率場の一部であるイジングモデルを再評価し、非凸代替損失関数をバイファクタード勾配降下法で最適化しています。ピッツバーグ大学医学センターとマス・ジェネラル・ブリガムからの58,248人の患者のEHRデータセットでアルゴリズムを評価し、グローバルな表現学習と関連検出、患者の表現型特定、クラスタリングなどの臨床タスクにおいて優れた性能を示しました。これにより、フェデレーテッドな高次元設定での統計的推論の潜在能力と、データの複雑性や多機関統合の実用的課題に取り組む意義が際立っています。