Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenAI新发布的o3-mini与DeepSeek R1全面对比

OpenAI新发布的o3-mini与DeepSeek R1全面对比

作者头像
AgenticAI
发布于 2025-03-18 08:35:04
发布于 2025-03-18 08:35:04
1430
举报
文章被收录于专栏:AgenticAIAgenticAI

OpenAI 发布了最新的推理模型——o3-mini,它专为科学、数学、编程等领域优化,提供更快的响应、更高的准确度和更低的成本。与前代 o1-mini 相比,o3-mini 在推理能力上有了显著提升,尤其在复杂问题解决上,测试者偏爱 o3-mini 的答案达 56%,错误率减少了 39%。从今天起,ChatGPT Plus、TeamPro用户可使用 o3-mini,免费用户也能体验其部分功能。

与同为推理模型DeepSeek-R1[1]相比,OpenAI o3-mini[2]到底比 R1 好多少呢?本文先大致过一下 o3-mini 的亮点,然后我们把双方在各个 benchmark 上的数据提取出来做个图直观比较一下。此外,我们还会比较一下 o3-mini 的价格。

1. 核心亮点:

1.STEM 优化:数学、编程、科学等领域表现优异,尤其在高推理努力模式下超越 o1-mini。

2.开发者功能:支持函数调用、结构化输出、开发者消息等功能,满足生产环境需求。

3.快速响应:比 o1-mini 快 24%,每个请求响应时间缩短至 7.7 秒。

4.安全性提升:通过深度对齐技术确保安全、可靠的输出。

5.低成本高效益:推理能力与成本优化并行,极大降低了 AI 使用门槛。

2. 比比看

Open AI 为了凸显逼格,其官方发布博客[3]中只给出与自己家的模型比较。因此本文是从 DeepSeek R1 的论文和 OpenAI 官方博客的数据中提取出来做的表格。

OpenAI 官方把 o3-mini 在版单中的对比,拆了 low,medium 和 high 三个版本,表示推理强度。由于 DeepSeek 采用的是 Math-500,而 OpenAI 是 Math 数据集,因此这里去掉了该项比较。

更为直观的是图表,其中去掉了 Codeforces,因为数值较大,无法直观显示。但是 Codeforces 上的比较,o3-mini 高推理强度也没有领先多少。

从图表上来看,共 4 项比较,O3-mini(high)总体上领先,领先的优势很小。

3. 价格

4.总结

随着 DeepSeek R1 在美国引发 DeepSeek Panic,而最先感受到威胁的就是 OpenAI,这从其发布的新模型 o3-mini 的定价上体现的尤其明显。从 o1 和 R1 相差 30 倍的价格,到 o3-mini 最终定价在 DeepSeek R1 价格的 2 倍,可见 DeepSeek R1 的威力。但 ChatGPT 的免费用户依然只能受限体验 o3-mini,而 DeepSeek 的深度思考目前是所有用户都能使用。从博主个人使用 R1 的感受来说,我想说 R1 的深度思考总能给我打开思路。推荐大家多多用来思考问题~

参考资料

[1]

DeepSeek-R1: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

[2]

OpenAI o3-mini: https://openai.com/index/openai-o3-mini/

[3]

官方发布博客: https://openai.com/index/openai-o3-mini/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
一文了解 DeepSeek R1 模型:AI 推理领域的革命性突破
2025 年 1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1。 这一模型在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将 API 调用成本降低了 90-95%。
飞询
2025/08/01
2270
一文了解 DeepSeek R1 模型:AI 推理领域的革命性突破
Claude 小升级就赢了OpenAI 9年“开源神作”?高强度推理直接歇菜、幻觉率高达50%,写作还被Kimi 2吊锤?
刚刚,OpenAI 发布了首个开源语言模型系列 gpt-oss,包括 gpt-oss-120b 和 gpt-oss-20b 两款语言模型:完全可定制,提供完整的思维链(CoT)并支持结构化输出。
深度学习与Python
2025/08/09
890
Claude 小升级就赢了OpenAI 9年“开源神作”?高强度推理直接歇菜、幻觉率高达50%,写作还被Kimi 2吊锤?
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
DeepSeek R1用「降维打击」重构了AI界,OpenAI不甘示弱放出了o3-mini,再次加冕为王。
新智元
2025/02/04
2210
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
o3-mini和DeepSeek-R1模型对比
o3-mini突然之间免费开放给普通用户,这次OpenAI宣布共有三个不同的版本:分别是o3-mini(low)、o3-mini(medium)和o3-mini
算法一只狗
2025/02/02
2.6K0
o3-mini和DeepSeek-R1模型对比
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
在人工智能快速发展的今天,一个激动人心的消息刚刚传来:DeepSeek 正式发布并开源了其最新力作 —— DeepSeek-R1 模型。这不仅是技术上的重大突破,更是开源社区的一次重要胜利。
程序员NEO
2025/03/07
7260
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。
机器之心
2025/02/05
2850
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
在上文OpenAI新发布的o3-mini与DeepSeek R1全面对比我们提到o3-mini价格相较o1削减了15倍左右,逼近DeepSeek R1的两倍价格,最终定价每百万输出4.4刀。
AgenticAI
2025/03/18
840
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
DeepSeek可以超越OpenAI吗?
其实并没有超越这一说,只是现在DeepSeek的热度让大家都意识到,以前那一套堆算力去训练大模型的方法,其实还有另一种可能。
算法一只狗
2025/02/01
3290
DeepSeek R1与OpenAI o1深度对比
在科技飞速发展的当下,人工智能领域中的大型语言模型(LLMs)正以前所未有的速度推动着通用人工智能(AGI)的发展进程。后训练环节在整个模型训练流程里占据着举足轻重的地位,它不仅能够显著提高模型在推理任务中的准确率,还能让模型更好地适应社会价值体系以及满足用户多样化的偏好。在这样的大背景下,DeepSeek R1和OpenAI o1作为当前人工智能推理模型中的佼佼者,其性能、特点以及发展潜力备受各界关注。本文将从技术原理、性能表现、应用场景、部署与集成、伦理考量、未来发展趋势等多个维度,对这两款模型展开深度剖析与对比。
码事漫谈
2025/01/27
4.3K0
DeepSeek R1与OpenAI o1深度对比
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
刚刚,OpenAI官宣o3-mini和o3-mini-high两大版本正式在ChatGPT上线。
新智元
2025/02/04
1550
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
DeepSeek为大模型领域带来了新的速度提升——就在昨天,OpenAI深夜紧急发布了其最新的推理模型:o3-mini系列,包含low、medium和high三个版本。
用户11203141
2025/03/06
1310
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。
机器之心
2025/02/25
3260
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
DeepSeek R1发布4天了,大家都在用它做什么?R1+Sonnet 在Aider获得 64.0% SOTA得分!
Cline社区发现了个有趣的工作流: 用DeepSeek R1(0.55美元/百万token)做规划,用Claude 3.5 Sonnet写代码。成本直接降低9
AI进修生
2025/02/03
1.6K0
DeepSeek R1发布4天了,大家都在用它做什么?R1+Sonnet 在Aider获得 64.0% SOTA得分!
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。
AI进修生
2025/02/03
7830
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
OpenAI深夜上线o3满血版和o4 mini - 依旧领先。
但是奥特曼这个老骗子,之前明明说o3不打算单独发布要融到GPT-5里面一起发,结果今天又发了。。。
数字生命卡兹克
2025/04/18
1100
OpenAI深夜上线o3满血版和o4 mini - 依旧领先。
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。不仅训练成本仅为 OpenAI 最先进的 o1 模型的一小部分,并且性能还能与其媲
机器之心
2025/02/03
4380
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
DeepSeek R1:中国AI黑马的崛起与挑战
在人工智能领域,大型语言模型(LLMs)正以迅猛之势重塑我们的世界,其发展速度和影响力令人瞩目。近期,中国DeepSeek公司发布的DeepSeek R1模型,宛如一颗璀璨新星,凭借卓越的推理能力和开源精神,在全球科技界掀起波澜,吸引了无数关注的目光。本文将深入剖析DeepSeek R1的技术突破、实验成果,以及其对行业发展带来的深远影响。
码事漫谈
2025/01/27
7020
DeepSeek R1:中国AI黑马的崛起与挑战
重磅升级!OpenAI o3-mini 空降 GitHub Copilot!好用到停不下来!
OpenAI的最新模型 o3-mini 现已在 GitHub Copilot 和 GitHub 模型中提供。将 OpenAI 的最新推理模型引入您的编码工作流程,现在可以立即使用!
程序视点
2025/02/07
2220
重磅升级!OpenAI o3-mini 空降 GitHub Copilot!好用到停不下来!
DeepSeek-R1:强化学习驱动的LLM推理能力提升
本文主要介绍一种新的训练策略,通过纯强化学习显著提升了LLM的推理能力,主要包括下面几点:
三掌柜
2025/02/06
4230
DeepSeek-R1:强化学习驱动的LLM推理能力提升
OpenAI 放大招:o3-mini 模型免费开放,API Key 获取流程简化!
2025年1月31日,OpenAI 再次震撼 AI 界,推出了全新的推理模型 o3-mini,并首次向免费用户开放 API!这一举措不仅让更多人有机会体验强大的 AI 技术,也彰显了 OpenAI 在激烈竞争中持续创新的决心。
攻坚克难的那份表
2025/02/11
3.9K0
推荐阅读
相关推荐
一文了解 DeepSeek R1 模型:AI 推理领域的革命性突破
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档