HackerNews

VibeThinker-1.5B

VibeThinker-1.5B

https://github.com/WeiboAI/VibeThinker


VibeThinker-1.5Bは、1.5Bパラメータを持つ密なモデルであり、小さなモデルでも強力な推論能力が発揮できることを証明した。特に「スペクトラムから信号への原則(SSP)」に基づいた革新的な後処理手法を確立し、閉じたソースのモデルよりも優れた推論能力を示した。具体的には、400倍大きいDeepSeek R1モデルに対しても数つの数学テストで優れた成績を収めた。また、コスト効率も高く、高性能推論モデルの開発経済を根本から変える可能性がある。VibeThinker-1.5Bはオープンソース化され、その性能評価プログラムも公開されている。数学とコーディングの問題に対する競技スタイルの活用が推奨されている。