arXiv cs.LG

複数グループへの公正クラスタリングの一般化: アルゴリズムと応用

Generalizing Fair Clustering to Multiple Groups: Algorithms and Applications

http://arxiv.org/abs/2511.11539v1


クラスタリングは機械学習やデータ分析の基本的なタスクですが、複数の保護属性によって定義されるさまざまなマイノリティコミュニティに対して公正な表現を提供できないことが多く、これはトレーニングデータの偏りによるものです。この研究では、特にデータポイントが2つ以上のグループに属する場合の「最も近い公正クラスタリング問題」を一般化します。最初に、全てのグループが同じサイズであってもこの問題がNP困難であることを示し、次に任意のサイズの複数グループを効率的に処理する近似アルゴリズムを提案します。加えて、公正相関クラスタリング問題や公正合意クラスタリング問題に対する新しい近似アルゴリズムを提示し、既存の研究を前進させることを目指しています。