この記事では、敵対的な線形バンディット問題を研究し、Follow-the-Regularized-Leader(FTRL)とFollow-the-Perturbed-Leader(FTPL)手法を結びつける統一されたアルゴリズムフレームワークを提案しています。このフレームワーク内では、自己一致摂動という確率分布の一群を導入し、これは以前にFTRLベースのSCRiBLeアルゴリズムで使用されていた自己一致バリアの役割を反映しています。このアイデアを使用して、自己一致を用いた正則化と効率的な確率探索を組み合わせた新しいFTPLベースのアルゴリズムを設計しました。提案手法は、d次元のハイパーキューブとユークリッドボールの両方でレグレットがO(d√(n ln n))を達成します。この結果は、ユークリッドボールで既存の自己一致FTRL手法が達成したレートと一致し、ハイパーキューブでの改善を示しています。