本論文では、組合バンディット問題に対する新しいアーム除去アルゴリズムを提案します。組合バンディットは、学習者が毎ラウンドで複数のアームを選択する設定であり、オンラインリコメンデーションやアソートメント最適化などの応用が考えられます。著者たちはアームを確認済、アクティブ、除去済の3つのカテゴリに分割し、これらのセットを更新するための明示的な探査を取り入れた新しい除去スキームを導入しました。提案手法は、一般グラフフィードバックを持つ組合マルチアームバンディットと、組合線形文脈バンディットの2つの設定で効果を示し、ほぼ最適な後悔確率を達成します。UCBベースの方法は十分な探査がないために失敗する可能性があります。