首页
学习
活动
专区
圈层
工具
发布

DeepSeek开源世界首个奥数金牌AI!

AI数学推理界迎来颠覆性突破!

DeepSeek 正式开源全新模型DeepSeekMath-V2.

不仅拿下 IMO 2025、CMO 2024 金牌级分数,更在 Putnam 2024 竞赛中狂揽118/120 分,狠狠超越人类最高分90 分,一举打破谷歌、OpenAI 的垄断格局。

作为首个开源的IMO金牌模型,DeepSeekMath-V2 的实力堪称 “降维打击”。

在 CNML 全类别难题测试中,它在代数、几何、数论等五大领域全面碾压 GPT-5-Thinking-High 和 Gemini 2.5-Pro,用硬实力改写了 AI 数学推理的竞争版图。

网友直呼:“开源界的神回来了,这下巨头们坐不住了!”

这款685B参数的大模型,核心突破在于解决了传统AI数学推理的三大痛点。

以往强化学习依赖最终答案奖励,常出现 “逻辑错误却答案正确” 的尴尬,且无法适配定理证明等需要严谨推导的任务。

DeepSeekMath-V2 独创迭代强化学习循环,让证明验证器与生成器协同进化,实现真正的自验证推理。

其创新机制堪称教科书级,彻底告别 “盲目自信”。

更惊艳的是自动化标注流程的实现。

通过多轮验证分析与元验证确认,模型完全取代了耗时的人工标注,且结果与专家判断高度一致。

搭配高计算量搜索策略,并行探索64条证明路径,精准捕捉细微错误,最终在顶级数学竞赛中实现对人类的超越。

值得关注的是,该模型背后的核心人物邵智宏研究员,正是此前提出经典 GRPO 算法的天才学者。

这位清华博士带领团队持续深耕,让 DeepSeek 在开源赛道上持续领跑。

DeepSeekMath-V2 的开源,不仅为科研界提供了强大的工具,更打破了巨头对高端数学模型的垄断。

未来,这款模型或将在科研推导、教育辅助等领域释放巨大潜力,让 AI 严谨推理能力惠及更多场景。

这场开源革命,才刚刚开始!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OP4YI3RMr52aft-sQNifWkqw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券