arXiv cs.AI

固有値: 固有値ベースのアプローチによる効率的なドメインロバストデータ評価

Eigen-Value: Efficient Domain-Robust Data Valuation via Eigenvalue-Based Approach

http://arxiv.org/abs/2510.23409v1


本文では、データ中心のAI時代におけるデータ評価の重要性について述べています。従来のデータ評価手法は、データを削除することによるモデルの検証性能の変化を分析しますが、出力分布(OOD)のデータとの一般化が困難です。これに対処するため、著者たちは「Eigen-Value(EV)」というフレームワークを提案します。EVはIDデータの共分散行列の固有値比を用いてドメインの差異をスペクトル的に近似し、データポイントごとの貢献度を計算します。この方法は計算負荷を軽減しつつ、IDに基づく損失関数にEVの項を追加することで軽量に運用できます。実世界のデータセットでの実験により、EVはOODに対するロバスト性と安定した価値ランクを提供することが示され、特にドメインシフトのある大規模な設定に対して実用的な選択肢であることが確認されました。