バリアンスを考慮したバンディットアルゴリズムの公平な評価のためのフレームワーク

本研究では、マルチアームバンディット（MAB）問題におけるアルゴリズムの性能評価と比較の課題を解決するためのフレームワークを提案しています。特に、古典的なMAB手法の変種であるバリアンスを考慮したアルゴリズムの評価が標準化されておらず、使用される環境によって性能が大きく左右されることから、計測が難しいことを認識しています。本評価フレームワークは、8つの古典的およびバリアンスを考慮したMABアルゴリズムを系統的に比較することを目的とし、実験設定や複数の性能指標を明確に定義したインターフェースを提供します。結果として、高不確実性の環境においてバリアンスを考慮したアルゴリズムが古典的なアルゴリズムよりも優れた性能を発揮する条件が明確に示されました。本研究は、MABアルゴリズムの評価の体系化と、バリアンスを考慮したアプローチの利点についての洞察を提供します。