ベクトルデータベースにおけるベクトルデータの取引は、クロスドメイン学習において重要ですが、ほとんど探求されていません。本研究では、オンライン学習の下で、売り手が不確実な取得コストに直面し、買い手が提示された価格に対して確率的フィードバックを提供する問題を扱います。主な課題として、(1) 構成学習における異種かつ部分的フィードバック、(2) 価格学習における変動的かつ複雑なフィードバック、(3) 構成と価格決定の間の固有の結合性があります。著者らは、取得の構成と価格設定を共同で最適化する階層的バンディットフレームワークを提案します。このフレームワークでは、ステージIで文脈クラスタリングを用いて効果的な構成を学習し、ステージIIで局所テイラー近似を用いて買い手の反応を推定します。理論的保証を確立し、実データセット上で実証実験を行った結果、既存の方法と比較して累積報酬と後悔の削減が持続的に見られました。