arXiv cs.AI

パラメータ重要度に基づく基盤モデルの継続学習

Parameter Importance-Driven Continual Learning for Foundation Models

http://arxiv.org/abs/2511.15375v1


本論文では、基盤モデルがドメイン特有の後処理を行う際に生じる記憶喪失問題に対処するための新しい手法「PIECE」を提案しています。従来の継続学習法は、性能が低下したり、過去のデータに依存する問題があります。PIECEは、重要なパラメータの一部(0.1%)のみを選択的に更新し、一般的な能力を維持しつつ、ドメイン知識を習得します。この過程では、フィッシャー情報に基づくPIECE-Fと、勾配および曲率情報を組み合わせたPIECE-Sの二つの重要度推定器を用います。実験の結果、PIECEは多様なタスクに対して最先端の継続学習性能を発揮し、基盤モデルのスケーラビリティと適応性を向上させる実用的なアプローチを強調しています。