arXiv cs.LG

シフトは良い:不一致データ混合がテストパフォーマンスを向上させる

Shift is Good: Mismatched Data Mixing Improves Test Performance

http://arxiv.org/abs/2510.25108v1


本研究では、異なる訓練とテストの割合を持つ混合分布における訓練とテストを考察しています。多くの状況において、分布のシフトが有益であり、訓練プロポーションが不一致であってもテストパフォーマンスが向上することを示します。これにより、構成要素同士の関連性がなく、転送がない場合でも効果が期待できることが示されました。研究により、最適な訓練比例や、そのような分布シフトが有益である程度を特定しました。また、訓練とテストのスキルの分布が異なる場合にも同様の分析が適用できることを示しています。