LinUCB(Linear Upper Confidence Bound)は、レコメンダーシステムで広く利用されている線形コンテキストバンディットの一つです。しかし、特徴の次元やアクション空間のサイズが大きくなると、トレーニング、推論、メモリコストが増大します。そこで、本論文では、Scalable LinUCBという新しいアルゴリズムを提案し、逆正則設計行列の操作を高速かつメモリ効率良く行えることを示しました。このアルゴリズムは、動的低ランクパラメータ化を利用して、安定したランク1およびバッチ更新を実現し、全体行列を形成せずに逆行列を維持します。メモリの成長を抑えるための手法として、動的低ランク近似の投影分割統合を用い、1ステップあたりの更新コストをO(dr)、メモリをO(dr)に抑えています。提案されたアルゴリズムの推論複雑度は、アクション評価あたりO(dr)であることが示されています。実験結果から、このアルゴリズムの効果が確認されました。