Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenAI新发布的o3-mini与DeepSeek R1全面对比

OpenAI新发布的o3-mini与DeepSeek R1全面对比

作者头像
AgenticAI
发布于 2025-03-18 08:35:04
发布于 2025-03-18 08:35:04
1260
举报
文章被收录于专栏:AgenticAIAgenticAI

OpenAI 发布了最新的推理模型——o3-mini,它专为科学、数学、编程等领域优化,提供更快的响应、更高的准确度和更低的成本。与前代 o1-mini 相比,o3-mini 在推理能力上有了显著提升,尤其在复杂问题解决上,测试者偏爱 o3-mini 的答案达 56%,错误率减少了 39%。从今天起,ChatGPT Plus、TeamPro用户可使用 o3-mini,免费用户也能体验其部分功能。

与同为推理模型DeepSeek-R1[1]相比,OpenAI o3-mini[2]到底比 R1 好多少呢?本文先大致过一下 o3-mini 的亮点,然后我们把双方在各个 benchmark 上的数据提取出来做个图直观比较一下。此外,我们还会比较一下 o3-mini 的价格。

1. 核心亮点:

1.STEM 优化:数学、编程、科学等领域表现优异,尤其在高推理努力模式下超越 o1-mini。

2.开发者功能:支持函数调用、结构化输出、开发者消息等功能,满足生产环境需求。

3.快速响应:比 o1-mini 快 24%,每个请求响应时间缩短至 7.7 秒。

4.安全性提升:通过深度对齐技术确保安全、可靠的输出。

5.低成本高效益:推理能力与成本优化并行,极大降低了 AI 使用门槛。

2. 比比看

Open AI 为了凸显逼格,其官方发布博客[3]中只给出与自己家的模型比较。因此本文是从 DeepSeek R1 的论文和 OpenAI 官方博客的数据中提取出来做的表格。

OpenAI 官方把 o3-mini 在版单中的对比,拆了 low,medium 和 high 三个版本,表示推理强度。由于 DeepSeek 采用的是 Math-500,而 OpenAI 是 Math 数据集,因此这里去掉了该项比较。

更为直观的是图表,其中去掉了 Codeforces,因为数值较大,无法直观显示。但是 Codeforces 上的比较,o3-mini 高推理强度也没有领先多少。

从图表上来看,共 4 项比较,O3-mini(high)总体上领先,领先的优势很小。

3. 价格

4.总结

随着 DeepSeek R1 在美国引发 DeepSeek Panic,而最先感受到威胁的就是 OpenAI,这从其发布的新模型 o3-mini 的定价上体现的尤其明显。从 o1 和 R1 相差 30 倍的价格,到 o3-mini 最终定价在 DeepSeek R1 价格的 2 倍,可见 DeepSeek R1 的威力。但 ChatGPT 的免费用户依然只能受限体验 o3-mini,而 DeepSeek 的深度思考目前是所有用户都能使用。从博主个人使用 R1 的感受来说,我想说 R1 的深度思考总能给我打开思路。推荐大家多多用来思考问题~

参考资料

[1]

DeepSeek-R1: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

[2]

OpenAI o3-mini: https://openai.com/index/openai-o3-mini/

[3]

官方发布博客: https://openai.com/index/openai-o3-mini/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
o3-mini和DeepSeek-R1模型对比
o3-mini突然之间免费开放给普通用户,这次OpenAI宣布共有三个不同的版本:分别是o3-mini(low)、o3-mini(medium)和o3-mini
算法一只狗
2025/02/02
2.6K0
o3-mini和DeepSeek-R1模型对比
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
DeepSeek R1用「降维打击」重构了AI界,OpenAI不甘示弱放出了o3-mini,再次加冕为王。
新智元
2025/02/04
2090
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
DeepSeek为大模型领域带来了新的速度提升——就在昨天,OpenAI深夜紧急发布了其最新的推理模型:o3-mini系列,包含low、medium和high三个版本。
用户11203141
2025/03/06
1280
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
刚刚,OpenAI官宣o3-mini和o3-mini-high两大版本正式在ChatGPT上线。
新智元
2025/02/04
1410
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
OpenAI 放大招:o3-mini 模型免费开放,API Key 获取流程简化!
2025年1月31日,OpenAI 再次震撼 AI 界,推出了全新的推理模型 o3-mini,并首次向免费用户开放 API!这一举措不仅让更多人有机会体验强大的 AI 技术,也彰显了 OpenAI 在激烈竞争中持续创新的决心。
攻坚克难的那份表
2025/02/11
3.6K0
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。
机器之心
2025/02/25
2620
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。
机器之心
2025/02/05
2650
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
还有完整版o3也快到来了, 此外Grok 3和Gemini 2.0 Pro等模型也在发布时间上线了:
AI进修生
2025/02/03
1830
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。
AI进修生
2025/02/03
7610
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
在人工智能快速发展的今天,一个激动人心的消息刚刚传来:DeepSeek 正式发布并开源了其最新力作 —— DeepSeek-R1 模型。这不仅是技术上的重大突破,更是开源社区的一次重要胜利。
程序员NEO
2025/03/07
3890
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
在上文OpenAI新发布的o3-mini与DeepSeek R1全面对比我们提到o3-mini价格相较o1削减了15倍左右,逼近DeepSeek R1的两倍价格,最终定价每百万输出4.4刀。
AgenticAI
2025/03/18
720
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
DeepSeek可以超越OpenAI吗?
其实并没有超越这一说,只是现在DeepSeek的热度让大家都意识到,以前那一套堆算力去训练大模型的方法,其实还有另一种可能。
算法一只狗
2025/02/01
2980
DeepSeek R1与OpenAI o1深度对比
在科技飞速发展的当下,人工智能领域中的大型语言模型(LLMs)正以前所未有的速度推动着通用人工智能(AGI)的发展进程。后训练环节在整个模型训练流程里占据着举足轻重的地位,它不仅能够显著提高模型在推理任务中的准确率,还能让模型更好地适应社会价值体系以及满足用户多样化的偏好。在这样的大背景下,DeepSeek R1和OpenAI o1作为当前人工智能推理模型中的佼佼者,其性能、特点以及发展潜力备受各界关注。本文将从技术原理、性能表现、应用场景、部署与集成、伦理考量、未来发展趋势等多个维度,对这两款模型展开深度剖析与对比。
码事漫谈
2025/01/27
4.2K0
DeepSeek R1与OpenAI o1深度对比
【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析
2025年1月20日,人工智能领域迎来里程碑式突破!深度求索(DeepSeek)正式发布新一代推理大模型DeepSeek-R1,不仅实现与OpenAI最新o1正式版的性能对标,更以全栈开放的生态布局引发行业震动。作为首个遵循MIT License开源协议的高性能推理模型,R1的发布将如何重构AI开发者的技术生态?其独创的"思维链API接口"又会给企业级应用带来哪些革新?
猫头虎
2025/01/24
2K0
【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
AI工具爆炸,模型遍地开花。今年的科研圈,要说最显眼的变化,绝对少不了“AI工具大跃进”。但问题来了!哪个模型,才是科研人该认真选择的外挂?
用户11203141
2025/03/12
3180
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
DeepSeek R1:中国AI黑马的崛起与挑战
在人工智能领域,大型语言模型(LLMs)正以迅猛之势重塑我们的世界,其发展速度和影响力令人瞩目。近期,中国DeepSeek公司发布的DeepSeek R1模型,宛如一颗璀璨新星,凭借卓越的推理能力和开源精神,在全球科技界掀起波澜,吸引了无数关注的目光。本文将深入剖析DeepSeek R1的技术突破、实验成果,以及其对行业发展带来的深远影响。
码事漫谈
2025/01/27
6740
DeepSeek R1:中国AI黑马的崛起与挑战
突破极限!R2模型如何比肩o3 mini?这3大关键点决定成败!
我最期待的就是,能够和OpenAI发布的o3 mini模型掰掰手腕,我感觉这就很炸裂了。毕竟o3 mini代表的是目前OpenAI能够提供给用户使用的最强大模型。
算法一只狗
2025/03/19
1450
【AGI-Eval评测报告 NO.6】o3 / o4-mini 文本权威评测:o3 强势登顶
① o3 毫无悬念的登顶,在交互能力、推理能力、指令遵循和初等数学四个方面全面领先;
AGI-Eval评测社区
2025/05/08
1590
【AGI-Eval评测报告 NO.6】o3 / o4-mini 文本权威评测:o3 强势登顶
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
随着 AI 能力的提升,一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和,比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。
机器之心
2025/02/28
930
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
DeepSeek R1发布4天了,大家都在用它做什么?R1+Sonnet 在Aider获得 64.0% SOTA得分!
Cline社区发现了个有趣的工作流: 用DeepSeek R1(0.55美元/百万token)做规划,用Claude 3.5 Sonnet写代码。成本直接降低9
AI进修生
2025/02/03
1.6K0
DeepSeek R1发布4天了,大家都在用它做什么?R1+Sonnet 在Aider获得 64.0% SOTA得分!
推荐阅读
o3-mini和DeepSeek-R1模型对比
2.6K0
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
2090
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
1280
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
1410
OpenAI 放大招:o3-mini 模型免费开放,API Key 获取流程简化!
3.6K0
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
2620
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
2650
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
1830
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
7610
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
3890
o3-mini是怎么做到价格削减15倍,逼近DeepSeek R1
720
DeepSeek可以超越OpenAI吗?
2980
DeepSeek R1与OpenAI o1深度对比
4.2K0
【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析
2K0
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
3180
DeepSeek R1:中国AI黑马的崛起与挑战
6740
突破极限!R2模型如何比肩o3 mini?这3大关键点决定成败!
1450
【AGI-Eval评测报告 NO.6】o3 / o4-mini 文本权威评测:o3 强势登顶
1590
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
930
DeepSeek R1发布4天了,大家都在用它做什么?R1+Sonnet 在Aider获得 64.0% SOTA得分!
1.6K0
相关推荐
o3-mini和DeepSeek-R1模型对比
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档