arXiv cs.LG

FIRM: 大規模言語モデルのためのフェデレーテッド・インクライアント・レギュラライズド・マルチオブジェクティブアライメント

FIRM: Federated In-client Regularized Multi-objective Alignment for Large Language Models

http://arxiv.org/abs/2511.16992v1


この記事では、FIRM(Federated In-client Regularized Multi-objective alignment)という新しいアルゴリズムを提案しています。このアルゴリズムは、大規模言語モデル(LLMs)の訓練における複数の対立する目的を効率的に調整し、クライアント間の不一致の軽減と通信効率を向上させます。従来のフェデレーテッド・マルチオブジェクティブ最適化(FMOO)の手法は、複数の勾配データをサーバーに送信する必要があるため、通信のボトルネックが生じていましたが、FIRMでは各クライアントがローカルで正則化された多目的最適化問題を解決し、単一の適応パラメータセットのみを送信することで、通信効率を保ちつつこの問題を解決します。実験的に、FIRMは訓練の動的安定性を向上させ、クライアント間の不一致を減少させ、報酬のトレードオフを改善することが示されています。また、目的に対する好みを組み込む方法も提案しており、これにより多タイプのトレードオフがスムーズに適応できることが実証されています。