首页
学习
活动
专区
圈层
工具
发布

DeepSeek开源新模型DeepSeekMath-V2

11月27日,DeepSeek开源了“奥数金牌级”模型DeepSeekMath-V2,该模型在数学定理证明能力上表现出色。DeepSeekMath-V2在2025年国际数学奥林匹克竞赛(IMO2025)和2024年中国数学奥林匹克竞赛(CMO2024)上取得金牌水平成绩,并在2024年普特南大学生数学竞赛(Putnam2024)上获得接近满分118分的成绩,超过人类最高90分成绩。该模型以10%优势击败谷歌的IMO金奖得主DeepThink模型。

DeepSeekMath-V2基于DeepSeek-V3.2-Exp-Base开发,通过强化学习训练模型生成证明分析,使用格式奖励和分数奖励两个奖励组件。在实验中,DeepSeekMath-V2在CNML级别所有问题类别中均优于GPT-5-Thinking-High和Gemini2.5-Pro。在高计算量探索中,该模型解决了2025IMO的5道题和2024CMO的4道题,达到金牌水平。尽管最困难的IMO级别问题仍具挑战性,但DeepSeek的生成器能在证明过程中识别问题,表明其验证器能够评估复杂推理任务的证明。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O5WeRYPJROHAcZOwc324ViCA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券