arXiv cs.LG

スケール不変ニューラルネットワークのトレーニングダイナミクスは理想気体の熱力学で説明できるか?

Can Training Dynamics of Scale-Invariant Neural Networks Be Explained by the Thermodynamics of an Ideal Gas?

http://arxiv.org/abs/2511.07308v1


深層ニューラルネットワークのトレーニングダイナミクスは依然として重要な課題であり、物理学に基づくアプローチが注目されています。本研究では、スケール不変ニューラルネットワークにおける確率的勾配降下法(SGD)の定常分布を記述するために、熱力学の枠組みを構築しました。この枠組みは、実用的な構造を反映しつつ理論的な分析を可能にします。トレーニングのハイパーパラメータと温度・圧力・体積などの熱力学的変数との類似性を示し、簡略化した各方程式モデルを用いてSGDの動態と理想気体の挙動との関係を明らかにしました。さらに、定常エントロピーの挙動が実験的観測に非常に一致することを示し、この枠組みがトレーニングダイナミクスを解釈するための原則的な基盤を提供することがわかりました。