arXiv cs.AI

文脈学習によるLLMsのデータ汚染検出

Detecting Data Contamination in LLMs via In-Context Learning

http://arxiv.org/abs/2510.27055v1


本稿では、CoDeC(Contextによる汚染検出)と呼ばれる、大規模言語モデルにおける訓練データの汚染を検出・定量化する実用的かつ正確な手法を提案します。CoDeCは、訓練中に記憶されたデータと訓練分布外のデータを区別するため、文脈学習がモデルの性能に与える影響を測定します。実験により、CoDeCは視覚化可能な汚染スコアを生成し、見たデータと見ていないデータを明確に分けることを示します。また、未公開の訓練コーパスを持つオープンウェイトモデルにおいて記憶の強い証拠を明らかにしました。手法は簡単で自動化されており、モデルやデータセットに依存しないため、ベンチマーク評価への統合も容易です。