HackerNews

Tongyi DeepResearch – OpenAI DeepResearchに匹敵するオープンソースの30B MoEモデル

Tongyi DeepResearch – open-source 30B MoE Model that rivals OpenAI DeepResearch

https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/


Tongyi DeepResearchは、OpenAIのDeepResearchと同等の性能を備えた初の完全オープンソースWebエージェントで、包括的なベンチマークスイートで最先端の結果を示しています。特に、学問的推論タスク「Humanity’s Last Exam」で32.9、複雑な情報探索タスクのBrowseCompで43.4、そしてユーザー中心のxbench-DeepSearchベンチマークで75を記録し、従来のプロプライエタリおよびオープンソースDeep Researchエージェントを体系的に凌駕しました。Tongyi DeepResearchは、エージェントの継続的な事前学習と強化学習を強化するための完全なメソッドを提供し、トレーニングパイプライン全体でのデータ合成ソリューションを詳細に説明しています。さらに、第一原則に基づいたデータ合成を通じて、インフラの強固さやアルゴリズムの革新に寄与しており、エージェントの意思決定能力を向上させています。