arXiv cs.AI

ssToken: 自己調整型および意味認識型トークン選択によるLLMファインチューニング

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

http://arxiv.org/abs/2510.18250v1


本稿では、LLM(大規模言語モデル)のファインチューニングを向上させるための新しいトークン選択手法「ssToken」を提案しています。従来のトークン選択方法は、追加の参照モデルを必要とし、損失情報のみに依存しているため、意味的に重要なトークンを適切に保存できないという課題がありました。ssTokenは、過去のモデルからの情報を利用し、トークンごとの損失差を計算することで自己調整信号を作成し、最適化の過程においてトークンを適応的に選択します。さらに、意味認識型の注意に基づく重要度評価指標を導入し、損失ベースの選択と補完的に機能します。実験結果から、ssTokenは全データのファインチューニングを上回る性能を示し、トークン選択手法においても優位性を示すことが実証されました。