arXiv cs.AI

DEEDEE: 高速でスケーラブルな分布外ダイナミクス検出

DEEDEE: Fast and Scalable Out-of-Distribution Dynamics Detection

http://arxiv.org/abs/2510.21638v1


本記事では、強化学習(RL)が安全性に敏感な設定で使用される際の課題として、分布シフトによる脆弱性に着目します。この課題に対処するために提案されたDEEDEEは、時間系列RLに対する分布外(OOD)検出を行う二統計ベースの検出器です。DEEDEEは、エピソード毎の平均とRBFカーネル類似性を用いることで、トレーニングの要約に対する全体および局所的な偏差を効率的に捉えます。シンプルな設計にもかかわらず、DEEDEEは従来のODD検出器と同等以上の性能を発揮し、計算量を600倍削減し、強力な基準と比較して平均5%の精度向上を達成します。これにより、複雑な環境におけるOOD検出のための効率的かつコンパクトな基盤を提供することが示唆されています。