前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >刚刚!Open AI GPT-4.5 震撼发布:无须推理也能比肩o3-mini !

刚刚!Open AI GPT-4.5 震撼发布:无须推理也能比肩o3-mini !

作者头像
AgenticAI
发布2025-03-18 16:46:41
发布2025-03-18 16:46:41
2140
举报
文章被收录于专栏:AgenticAIAgenticAI

就在刚刚,GPT-4.5 研究预览版正式上线!作为Open AI迄今为止最大、最强的聊天模型,GPT-4.5 不仅交互更自然,还展现了“无须推理也能更强大”的惊艳能力,甚至在部分榜单上直接超越了 OpenAI 的 o3-mini。

“无须推理”也能这么强? GPT-4.5 的核心亮点在于:它通过更大规模的预训练和后训练,显著提升了无监督学习能力。这意味着,GPT-4.5 可以在不依赖复杂推理的情况下,快速识别模式、建立关联,并生成富有创意的洞察。这种“无须推理也能更强大”的特性,让它在多个领域展现了惊艳的表现。 来看看 GPT-4.5 在基准测试中的表现:

尤其值得一提的是,在 SWE-Lancer Diamond(编程)MMMLU(多语言)两项测试中,GPT-4.5 的表现直接超越了 OpenAI 的o3-mini!在编程任务 SWE-Lancer Diamond 上,GPT-4.5 拿下 32.6% 的成绩,而 o3-mini 仅为 10.8%,差距明显!在多语言能力 MMMLU 上,GPT-4.5 更是以 85.1% 的成绩领先 o3-mini 的 81.1%。

这意味着,GPT-4.5 在处理复杂编码和多语言任务时,已经展现出超越对手的硬核实力——而且这一切,还是在“无须推理”的模式下完成的!

分步上线,Pro 用户抢先体验 即日起,GPT-4.5 将向所有 ChatGPT Pro 用户推送。下周,Plus 和 Team 用户也将解锁体验;再下周,Enterprise 和 Edu 用户也能加入。不管你是个人用户还是企业团队,GPT-4.5 的强大实力都值得一试。

更自然、更贴心的交互体验 除了硬核性能,GPT-4.5 的交互体验也更上一层楼。早期测试显示,它不仅知识储备更广,还能更精准地理解用户意图,甚至在“情商”上都有了显著提升。无论是润色文章、写代码,还是解决实际问题,GPT-4.5 都能轻松胜任。

功能上,GPT-4.5 支持搜索最新信息、上传文件和图片,还能在 Canvas 模式下帮你修改文章或调试代码。目前,它还不支持 Voice Mode、视频或屏幕共享等功能,但未来他们会逐步完善这些体验。

彩蛋!

OpenAI在直播中回顾了自GPT-1到GPT4.5历代模型回答同一个问题,海水为何是咸的,正如我经常问的天空为何是蓝色的😂。

非常有趣,可以直观看到每代模型智能升级,我其实非常好奇GPT 2到GPT 3.5 Turbo这4年里发生了啥?

GPT-1(2018)

GPT-2(2019)

GPT-3.5 Turbo(2023)

GPT-4-Turbo(2023)

GPT-4.5(2025)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档