arXiv cs.LG

クロスバリデーション誤差の構造:安定性、共分散、およびミニマックス限界

The Structure of Cross-Validation Error: Stability, Covariance, and Minimax Limits

http://arxiv.org/abs/2511.03554v1


この記事では、クロスバリデーション(CV)の誤差の構造について探求しています。CVの理論的研究は進行中ですが、それに関する多くの質問は未解決のままです。本研究では、アルゴリズムと分布のペアがk分割クロスバリデーションにおけるフォールド数の選択に与える影響を調査しました。著者らは、リスク推定のためのCVの平均二乗誤差の新しい分解を提案し、重複するフォールド間の誤差推定の相関を明示的に捉えています。また、CVの最小限界を示し、理想的な条件下でもCVは最適なリスク評価を得られないことを明らかにしました。ここで発表された結果は、リサンプリングに基づくリスク推定の基本的なトレードオフを delineate し、CVによる偏りのないリスク評価にはnサンプルを完全には活用できないことを示しています。