arXiv cs.AI

判定者としてのLLM: スレート推薦システムのための世界モデルへ

LLM-as-a-Judge: Toward World Models for Slate Recommendation Systems

http://arxiv.org/abs/2511.04541v1


この記事では、スレート推薦研究におけるユーザーの好みのモデル化の課題について論じています。著者たちは、大規模言語モデル(LLM)がどのようにしてユーザーの好みの世界モデルとして機能できるかを探求し、ペアワイズ推論を通じてスレートを評価する実証研究を行いました。複数のLLMを用いた3つの異なるデータセットに関するタスクの結果から、タスクのパフォーマンスとLLMが捉える好みの関数性質との関係が明らかになりました。この結果は、推薦システムにおけるLLMの改善の可能性とその重要性を示唆しています。