

GPT-5 和OpenAI的一种新的实验推理模型在 2025 年国际大学编程竞赛世界总决赛上在不到 5 小时的时间内解决了所有 12 个算法问题。超越人类最强队伍 11/12。
Google DeepMind 的 Gemini 2.5 Deep Think 获 10/12,相当于人类第二名;值得注意的是这也是Gemini的一个高级版本。

ICPC 是全球顶尖大学队伍参与、解决复杂算法问题的最高级别大学生程序设计竞赛,通常被称为“编程奥林匹克”。它吸引了来自大约 3,000 所大学的参与者。
在今年的排名中,圣彼得堡国立大学排名第一,其次是东京大学、北京交通大学、清华大学和北京大学的团队。哈佛排名第六。

GPT-5 于 2025 年 8 月发布,是 OpenAI 首款“代理式”模型,在 SWE-bench(真实 GitHub 问题解决)基准上达 74.9%,远超 o3 的 69.1%。
ICPC 现场的 AI 赛道,规则和人类赛道完全一致:5 小时内解完 12 道题,提交到 ICPC 世界总决赛的本地评测系统,与人类参赛队伍的提交同时、同标准判题。

题目以完全相同的 PDF 格式发送,推理系统自主选择要提交的答案,没有任何专门定制的比赛时辅助工具。12 道题里有 11 道,AI的第一个答案就正确;最难的一题在第 9 次提交时解出。值得注意的是,今年最强的人类队伍成绩是 11/12。
人类组:

他们使用通用推理模型参赛,没有针对 ICPC 进行任何专门训练。参赛时同时使用了 GPT-5 和一个实验性推理模型(未发布)来生成解答,由实验性推理模型负责挑选要提交的方案。最终,GPT-5 解出了 11 道题,而最后一道最难的题目则由实验性推理模型解决。

OpenAI 技术人员 @MostafaRohani表示:
这一成果为我们一系列成果画上了精彩的句号,充分展示了推理系统的惊人进步速度。同一套模型还参加了 IMO(国际数学奥林匹克) 和 IOI(国际信息学奥林匹克),凸显了这些系统的通用性。

这仅仅是一个开始,我个人对我们的研究路线图感到非常兴奋。下一阶段的前沿是 新知识的发现,这才是真正的里程碑。
这是 ICPC 2025 最棘手的问题

— OpenAI 需要 9 次尝试才能解决
— 2 个 DeepMind 中的一个根本没有解决
— 最快的人类花了 270 分钟来解决总共 300 分钟
问题 G:熔岩护城河。
还有一个问题 C,没有大学团队可以解决。不过,Gemini 和 OpenAI (GPT 5) 可以解决这个问题。相当惊人。

MostafaRohani表示:
记得当我加入 OpenAI 时,我们最强的 AI 模型几乎连 Codeforces 的简单题目都解不出来。看到过去两年进步的速度,真是令人难以置信。和这个团队一起,我非常期待未来两年我们能取得什么成就!

比赛本身充满了激情,汇聚了世界上最聪明的年轻才俊。
OpenAI CEO Sam Altman 宣布赠送所有参赛者一年 ChatGPT Pro,鼓励青年才俊探索 AI。

网友提问是GPT5-High吗?

我觉得至少不会是我们平常用户端那个普通的GPT5。
谷歌和Gemini 的“高级”版本参加了此次竞赛,这个推理模型于 4 月首次发布。该算法通过并行生成大量潜在解答来处理复杂问题,然后对这些解答进行精炼,最终汇总成一个有效的解答。
根据 Google 的说法,参与 ICPC 的 Gemini 2.5 Deep Think 版本使用了 AI 代理生成每个问题的多个潜在解答。这些代理可以访问一个终端,用于运行和测试代码。在生成初步代码后,代理们还会对其进行优化,提升测试响应的质量。
Google 研究人员在博客中表示:“在 ICPC 中获得金牌,具有直接的实际意义。除了数学和编程,这一成就展示了在抽象推理方面的强大新能力。ICPC 所需的技能——理解复杂问题、设计多步骤的逻辑计划并完美执行——正是许多科学和工程领域所需要的技能。”
以及谷歌团队的一篇博客文章,详细介绍了他们这边的一切。https://reurl.cc/jreV81
还分享了Gemini比大学生解决它更快的问题。
“ 我们的表现融合了一系列突破,包括:
🔘 预训练和后训练
🔘 新型强化学习技术
🔘 多步骤推理
🔘 并行思维
这些帮助Gemini探索解决复杂问题和验证解决方案的方法。”

通过之前的所有 IMO/IOI/Atcoder 比赛,人工智能~与最好的人类一样好,也许略低于。

总之,两年时间,AI 飞速成长,而且越来越强大,未来更令人期待。

来吧,DEEPSEEK,做点什么吧。hh

以上。
🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
点这里👇关注我,记得标星哦~