首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >刚刚,GPT-5 横扫编程奥林匹克,5 小时打穿 12 题!人类最强队伍只能做出11道

刚刚,GPT-5 横扫编程奥林匹克,5 小时打穿 12 题!人类最强队伍只能做出11道

作者头像
AI进修生
发布2025-09-30 15:39:00
发布2025-09-30 15:39:00
2300
举报
文章被收录于专栏:AI进修生AI进修生

GPT-5 和OpenAI的一种新的实验推理模型在 2025 年国际大学编程竞赛世界总决赛上在不到 5 小时的时间内解决了所有 12 个算法问题。超越人类最强队伍 11/12。

Google DeepMind 的 Gemini 2.5 Deep Think 获 10/12,相当于人类第二名;值得注意的是这也是Gemini的一个高级版本。

ICPC 是全球顶尖大学队伍参与、解决复杂算法问题的最高级别大学生程序设计竞赛,通常被称为“编程奥林匹克”。它吸引了来自大约 3,000 所大学的参与者。

在今年的排名中,圣彼得堡国立大学排名第一,其次是东京大学、北京交通大学、清华大学和北京大学的团队。哈佛排名第六。

GPT-5 于 2025 年 8 月发布,是 OpenAI 首款“代理式”模型,在 SWE-bench(真实 GitHub 问题解决)基准上达 74.9%,远超 o3 的 69.1%。

ICPC 现场的 AI 赛道,规则和人类赛道完全一致:5 小时内解完 12 道题,提交到 ICPC 世界总决赛的本地评测系统,与人类参赛队伍的提交同时、同标准判题。

题目以完全相同的 PDF 格式发送,推理系统自主选择要提交的答案,没有任何专门定制的比赛时辅助工具。12 道题里有 11 道,AI的第一个答案就正确;最难的一题在第 9 次提交时解出。值得注意的是,今年最强的人类队伍成绩是 11/12

人类组:

他们使用通用推理模型参赛,没有针对 ICPC 进行任何专门训练。参赛时同时使用了 GPT-5 和一个实验性推理模型(未发布)来生成解答,由实验性推理模型负责挑选要提交的方案。最终,GPT-5 解出了 11 道题,而最后一道最难的题目则由实验性推理模型解决。

OpenAI 技术人员 @MostafaRohani表示:

这一成果为我们一系列成果画上了精彩的句号,充分展示了推理系统的惊人进步速度。同一套模型还参加了 IMO(国际数学奥林匹克)IOI(国际信息学奥林匹克),凸显了这些系统的通用性。

这仅仅是一个开始,我个人对我们的研究路线图感到非常兴奋。下一阶段的前沿是 新知识的发现,这才是真正的里程碑。

这是 ICPC 2025 最棘手的问题

— OpenAI 需要 9 次尝试才能解决

— 2 个 DeepMind 中的一个根本没有解决

— 最快的人类花了 270 分钟来解决总共 300 分钟

问题 G:熔岩护城河。

还有一个问题 C,没有大学团队可以解决。不过,Gemini 和 OpenAI (GPT 5) 可以解决这个问题。相当惊人。

MostafaRohani表示:

记得当我加入 OpenAI 时,我们最强的 AI 模型几乎连 Codeforces 的简单题目都解不出来。看到过去两年进步的速度,真是令人难以置信。和这个团队一起,我非常期待未来两年我们能取得什么成就!

比赛本身充满了激情,汇聚了世界上最聪明的年轻才俊。

OpenAI CEO Sam Altman 宣布赠送所有参赛者一年 ChatGPT Pro,鼓励青年才俊探索 AI。

网友提问是GPT5-High吗?

我觉得至少不会是我们平常用户端那个普通的GPT5。

谷歌参赛情况

谷歌和Gemini 的“高级”版本参加了此次竞赛,这个推理模型于 4 月首次发布。该算法通过并行生成大量潜在解答来处理复杂问题,然后对这些解答进行精炼,最终汇总成一个有效的解答。

根据 Google 的说法,参与 ICPC 的 Gemini 2.5 Deep Think 版本使用了 AI 代理生成每个问题的多个潜在解答。这些代理可以访问一个终端,用于运行和测试代码。在生成初步代码后,代理们还会对其进行优化,提升测试响应的质量。

Google 研究人员在博客中表示:“在 ICPC 中获得金牌,具有直接的实际意义。除了数学和编程,这一成就展示了在抽象推理方面的强大新能力。ICPC 所需的技能——理解复杂问题、设计多步骤的逻辑计划并完美执行——正是许多科学和工程领域所需要的技能。”

以及谷歌团队的一篇博客文章,详细介绍了他们这边的一切。https://reurl.cc/jreV81

还分享了Gemini比大学生解决它更快的问题。

“ 我们的表现融合了一系列突破,包括:

🔘 预训练和后训练

🔘 新型强化学习技术

🔘 多步骤推理

🔘 并行思维

这些帮助Gemini探索解决复杂问题和验证解决方案的方法。”

通过之前的所有 IMO/IOI/Atcoder 比赛,人工智能~与最好的人类一样好,也许略低于。

总之,两年时间,AI 飞速成长,而且越来越强大,未来更令人期待。

来吧,DEEPSEEK,做点什么吧。hh

以上。

🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

点这里👇关注我,记得标星哦~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI进修生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 谷歌参赛情况
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档