DeepSeek开源世界首个奥数金牌AI!

文章来源：企鹅号 - 倪云华新知

AI数学推理界迎来颠覆性突破!

DeepSeek 正式开源全新模型DeepSeekMath-V2.

不仅拿下 IMO 2025、CMO 2024 金牌级分数，更在 Putnam 2024 竞赛中狂揽118/120 分，狠狠超越人类最高分90 分，一举打破谷歌、OpenAI 的垄断格局。

作为首个开源的IMO金牌模型，DeepSeekMath-V2 的实力堪称 “降维打击”。

在 CNML 全类别难题测试中，它在代数、几何、数论等五大领域全面碾压 GPT-5-Thinking-High 和 Gemini 2.5-Pro，用硬实力改写了 AI 数学推理的竞争版图。

网友直呼：“开源界的神回来了，这下巨头们坐不住了!”

这款685B参数的大模型，核心突破在于解决了传统AI数学推理的三大痛点。

以往强化学习依赖最终答案奖励，常出现 “逻辑错误却答案正确” 的尴尬，且无法适配定理证明等需要严谨推导的任务。

DeepSeekMath-V2 独创迭代强化学习循环，让证明验证器与生成器协同进化，实现真正的自验证推理。

其创新机制堪称教科书级，彻底告别 “盲目自信”。

更惊艳的是自动化标注流程的实现。

通过多轮验证分析与元验证确认，模型完全取代了耗时的人工标注，且结果与专家判断高度一致。

搭配高计算量搜索策略，并行探索64条证明路径，精准捕捉细微错误，最终在顶级数学竞赛中实现对人类的超越。

值得关注的是，该模型背后的核心人物邵智宏研究员，正是此前提出经典 GRPO 算法的天才学者。

这位清华博士带领团队持续深耕，让 DeepSeek 在开源赛道上持续领跑。

DeepSeekMath-V2 的开源，不仅为科研界提供了强大的工具，更打破了巨头对高端数学模型的垄断。

未来，这款模型或将在科研推导、教育辅助等领域释放巨大潜力，让 AI 严谨推理能力惠及更多场景。

这场开源革命，才刚刚开始!

相关快讯