arXiv cs.LG

LIME: デカップリングされたxorアテンションを用いたリンクベースのユーザー-アイテム相互作用モデルによる効率的なテスト時間スケーリング

LIME: Link-based user-item Interaction Modeling with decoupled xor attention for Efficient test time scaling

http://arxiv.org/abs/2510.18239v1


この記事では、LIMEという新しいアーキテクチャが提案されています。このモデルは、推薦システムのスケーリングを効率化するため、ユーザー履歴の処理、候補セットの拡大、モデルの能力向上という3つの重要な課題を解決します。LIMEは、低次元の「リンク埋め込み」を使用してユーザーと候補の相互作用をデカップリングし、注意重みの事前計算を可能にすることで、推論コストを候補セットのサイズにほぼ独立にする点が特徴です。また、LIMEでは線形アテンションメカニズムであるLIME-XORを導入しており、これによりユーザーシーケンスの長さにおける複雑さを二次関数から線形に減少させます。実験では、LIMEが最先端のトランスフォーマーとほぼ同じ性能を保ちながら、候補セットやシーケンスの長さが大きい場合でも10倍の推論速度を達成することが示されました。