arXiv cs.AI

トランスフォーマーによるベイジアン・クラスタリングの実現

Transformers can do Bayesian Clustering

http://arxiv.org/abs/2510.24318v1


この記事では、トランスフォーマーモデルを用いた新たなベイジアン・クラスタリング手法「Cluster-PFN」を紹介しています。ベイジアン・クラスタリングは不確実性を考慮しますが、大規模なデータでの計算が困難です。また、実データには欠損値が多く、単純な補完では潜在的な不確実性を無視してしまいます。Cluster-PFNは、合成データに基づいてトレーニングされ、クラスタ数やクラスタ割当の後方分布を推定します。この手法は、AICやBIC、変分推論に比べてクラスタ数の推定精度が高く、計算速度でも優れています。特に、欠損データを含む複雑な事前分布に対しても高いパフォーマンスを示し、実世界のゲノムデータセットにおいて補完ベースの手法を上回る結果を達成しました。この研究は、スケーラブルで柔軟なベイジアン・クラスタリングを実現する可能性を示しています。