arXiv cs.LG

スパース楽観的情報指向サンプリング

Sparse Optimistic Information Directed Sampling

http://arxiv.org/abs/2510.24234v1


本論文では、「スパース楽観的情報指向サンプリング(SOIDS)」という新しいアルゴリズムを提案し、高次元のオンライン意思決定問題における最適な結果を達成する方法を探ります。従来のアルゴリズムはデータが豊富な場合と乏しい場合で最適な後悔を追求していますが、SOIDSはベイズ的仮定なしに最悪の場合の設定でも適応性を持ちます。新しい解析方法により、時間依存の学習率を使用し、情報と後悔のバランスを最適化することが可能であることを示しました。本研究は、両方のデータシナリオにおいて最適な最悪後悔を同時に達成する最初のアルゴリズムとして、IDSの理論的保証を拡張するものです。実験においてもSOIDSの良好な性能を実証しました。