arXiv cs.AI

H-LDM:臨床メタデータからの制御可能で解釈可能なPCG合成のための階層型潜在拡散モデル

H-LDM: Hierarchical Latent Diffusion Models for Controllable and Interpretable PCG Synthesis from Clinical Metadata

http://arxiv.org/abs/2511.14312v1


この記事では、心音図(PCG)の分析が心血管疾患の診断において重要である一方で、ラベル付けされた病変データの不足がAIシステムの能力を制限している現状を背景に、H-LDM(階層型潜在拡散モデル)を提案しています。このモデルは、臨床メタデータから clinically 正確かつ制御可能なPCG信号を生成することを目的としています。H-LDMは、(1)リズム、心音、雑音を分離する生理的に解脱した潜在空間を学習するマルチスケールVAE、(2)17種類の異なる状態に対する精密な制御が可能な階層型テキストから生体信号へのパイプライン、(3)新しい医療注意モジュールによって導かれる解釈可能な拡散プロセスなどの特徴があります。PhysioNet CirCor データセットでの実験結果は、特に異常な病気の分類精度を向上させ、心臓専門医による臨床的妥当性の確認も得られました。H-LDMは、心臓診断におけるデータ増強の新たな方向性を示しています。