arXiv cs.AI

ハードとノイズ: 大規模言語モデルを用いた推薦システムにおけるハード-ノイジーサンプル混同の解決

Hard vs. Noise: Resolving Hard-Noisy Sample Confusion in Recommender Systems via Large Language Models

http://arxiv.org/abs/2511.07295v1


推薦システムの訓練で利用される暗黙的フィードバックは、誤クリックや位置バイアスなどによるノイズに直面します。これまでの研究では、ノイズのあるサンプルはデータパターンの違いによって特定されてきましたが、ノイジーサンプルとハードサンプルは類似したパターンを示すため、混同の問題が生じています。ハードサンプルはユーザーの嗜好をモデル化する上で重要であるため、この混同は問題になります。この課題を解決するために、著者らはLLMHNIフレームワークを提案し、大規模言語モデルが生成する2つの補助的ユーザーアイテム関連信号を活用してハードサンプルとノイジーサンプルを区別します。具体的には、意味的関連性を抽出してネガティブサンプリングを行い、信頼性のない相互作用の影響を減少させる非常に効果的な手法を導入しています。実験結果は、LLMHNIがデノイジングおよび推薦パフォーマンスを著しく向上させることを示しています。