arXiv cs.LG

AIトレーディングエージェントが競争する時: 強化学習に基づくメタオーダーの逆選択

When AI Trading Agents Compete: Adverse Selection of Meta-Orders by Reinforcement Learning-Based Market Making

http://arxiv.org/abs/2510.27334v1


本研究では、中頻度取引エージェントが高頻度取引者による逆選択のメカニズムを探求しています。強化学習(RL)を用いたHawkes限界注文書(LOB)モデルを採用し、高頻度マーケットメイカーの行動を再現します。従来のモデルでは外因的な価格影響を仮定していましたが、Hawkesモデルでは内因的な価格影響や市場の重要な特性を考慮します。中頻度トレーダー(MFT)のメタオーダー実行エージェントと対戦するRLエージェントのトレーニングを通じて、マーケットメイキングエージェントがそのメタオーダーによって誘発される価格の偏りを利用することを学ぶ様子を示します。最近の実証研究では、中頻度取引者が高頻度取引エージェントによる逆選択の影響をますます受けていることが示されていますが、マーケットメイキングRLエージェントの利益が中頻度トレーダーのスリッページコストの増加に必ずしも繋がるわけではないと観察されました。