arXiv cs.AI

RedOne 2.0: ソーシャルネットワーキングサービスにおけるドメイン特化型大規模言語モデルのポストトレーニングの再考

RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking Services

http://arxiv.org/abs/2511.07070v1


本文では、ソーシャルネットワーキングサービス(SNS)が、大規模言語モデル(LLMs)にとって特有の課題を提示することを指摘しています。SNSは多様なデータや急速に変化する文化的な用語を含み、これがモデルのパフォーマンスに影響を与えるからです。従来のスーパーバイズドファインチューニング(SFT)では、分布内の性能向上と分布外の堅牢性の間にトレードオフが生じることがあります。これらの課題に対処するために、著者たちはRedOne 2.0を提案しています。これは、SNS向けに設計された進化的なRL優先ポストトレーニングパラダイムに基づいています。この方法は、選択的なファインチューニングと、SNS中心のシグナルを利用した強化学習によって進化を図り、データ効率と安定性を向上させています。RedOne 2.0は、さまざまなタスクで顕著な性能向上を示し、SNSに特化したLLMの新たな基準を確立しています。