arXiv cs.LG

いつでも最適なアーム識別のためのレート最適設計

Rate-optimal Design for Anytime Best Arm Identification

http://arxiv.org/abs/2510.23199v1


本論文では、サンプリング予算が限られた中で、K本のアームから最も平均報酬が高いアームを特定する「最適アーム識別問題」を考察しています。この問題はA/Bテストなど多くの実用的シナリオをモデル化しています。著者らは、この問題に対するアルゴリズムのクラスを提案し、既存の固定予算型アプローチからの一般化を行っています。特に、Almost Trackingと呼ばれる閉形式アルゴリズムを提案し、人気のリスク指標$H_1$に関する保証を提供します。このアルゴリズムは、事前に全体予算を決定する必要がなく、重要なサンプルを捨てることなく実施可能であるため、実用的な利点を持っています。合成データセットおよび実世界データセットにおける実験を通じて、提案するアルゴリズムが既存のいつでも利用可能なアルゴリズムや固定予算アルゴリズムと比較して優れた性能を持つことを示しています。