arXiv cs.AI

オラクルとプリズム:生成推薦説明のための非対称で効率的なフレームワーク

The Oracle and The Prism: A Decoupled and Efficient Framework for Generative Recommendation Explanation

http://arxiv.org/abs/2511.16543v1


この記事では、説明可能な推薦システムに大規模言語モデル(LLM)を組み込む際に生じるパフォーマンスと効率のトレードオフを解決するために、非対称フレームワーク「プリズム」を提案しています。このフレームワークは、推薦プロセスを特化したランキングステージと説明生成ステージに厳密に分離します。知識蒸留から着想を得て、強力な教師モデルを「オラクル」として使用し、高忠実の説明的知識を生成します。次に、コンパクトで微調整された生徒モデル「プリズム」が、この知識を個別化された説明に合成します。この分解により、各コンポーネントが特定の目標に向けて最適化され、カップリングモデルの固有の対立が排除されます。実験結果により、140Mパラメータのプリズムモデルが、110Bパラメータの教師モデルよりも忠実性と個別化の評価で大幅に優れ、推論中のスピードを24倍、メモリ消費を10倍削減できることが示されています。この結果は、非対称化とターゲットを絞った蒸留が高品質な説明可能推薦への効率的かつ効果的な道筋を提供することを裏付けています。