arXiv cs.AI

EdgeRunner 20B: エッジで動作するGPT-5との軍事タスク同等性

EdgeRunner 20B: Military Task Parity with GPT-5 while Running on the Edge

http://arxiv.org/abs/2510.26550v1


EdgeRunner 20Bは、軍事タスクに最適化されたgpt-oss-20bのファインチューニング版であり、160万の高品質な軍事ドキュメントとウェブサイトから収集されたデータで訓練されました。新たに4つのテストセット(戦闘部隊、戦闘医、サイバー操作、一般的な軍事知識のmil-bench-5k)が導入され、EdgeRunner 20Bはこれらの軍事テストセットにおいて、GPT-5のタスクパフォーマンスに対して95%以上の統計的有意性を持って一致または超過しています。一般的なベンチマークに関しては、gpt-oss-20bに対して統計的に有意な回帰は見られず、軍事分野におけるデータセンシティブな操作には、小型のローカルホステッドモデルが理想的であることが示されています。