arXiv cs.LG

アクティブデータ拡張によるオフラインの嗜好学習のクラスタリング

Offline Clustering of Preference Learning with Active-data Augmentation

http://arxiv.org/abs/2510.26301v1


この記事では、ペアワイズフィードバックからの嗜好学習におけるオフラインクラスタリングの問題を扱っています。実際の応用においては、ユーザーの相互作用が限られているため、オフラインで嗜好を学習する必要があります。異なる嗜好を持つユーザーのデータを効果的に集約することと、嗜好の次元が不均衡なオフラインデータを処理することが課題です。提案された手法、Off-C$^2$PLは、オフラインデータのみに依存しており、サンプルノイズとバイアスのトレードオフを分析します。また、A$^2$-Off-C$^2$PLでは、ユーザーの嗜好の情報が少ない次元をターゲットにしたアクティブデータを選択することで、より効果的なデータ収集を実現します。これらのアルゴリズムは、シミュレーションを通じてその理論的結果を検証しています。