オンライン分類における人間の介入の最小化

本論文では、質問応答システムにおけるオンライン分類の問題を紹介し、研究しています。この問題では、エージェントがユーザーから提出されたクエリを次々に分類しなければなりません。それぞれのクエリは未知の分布から生成された$d$次元の埋め込みで表現されます。エージェントは、高価な人間の専門家に正しいラベルを尋ねることも、自力で推測することもできますが、目標は無制限にアクセスできるオラクルに対する後悔を最小化することです。時間の範囲$T$が埋め込み次元$d$に対して指数的な場合、エージェントはクラス領域の幾何学を学習できるため、保守的ハルベースの分類器（CHC）を提案しました。CHCは、専門家によってラベル付けされたクエリの凸ハルを維持し、クエリがすべての既知のハルの外に出た場合にのみ専門家に相談します。また、本研究では、クエリがサブガウス混合モデルから抽出された場合の一般化ハルベースの分類器（GHC）を提案し、実世界のデータセットでの実験によってその有効性を検証しています。