本論文では、文脈バンディットにおけるマルチタスク学習の重要性と新たな経験的ベイジアンフレームワークを提案します。このフレームワークは、異なるバンディットインスタンス間の異質性と相関を捉え、情報を効果的に共有しつつ、インスタンス固有の変動にも対応します。従来の手法がバンディット間の共分散構造の学習を無視しているのに対し、本研究は共分散行列の推定による経験的ベイジアンアプローチを導入しています。このアプローチを基に、ebmTS(経験的ベイジアンマルチバンディットトンプソンサンプリング)およびebmUCB(経験的ベイジアンマルチバンディット上限信頼境界)の二つの効率的なアルゴリズムを開発しました。提案手法の性能は、合成データおよび実世界のデータセットにおいて、特に複雑な環境での低累積後悔を実現することで示されています。