首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?

Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?

作者头像
AI进修生
发布2025-06-08 18:30:05
发布2025-06-08 18:30:05
6270
举报
文章被收录于专栏:AI进修生AI进修生

谷歌又悄悄更新了 Gemini 2.5 Pro 模型

官方说,这次是 Gemini 2.5 Pro 的升级预览版,是他们目前最聪明的模型。在五月份发布和 I/O 大会上展示的版本基础上又优化了。几周后,这个版本就会成为正式的稳定版,可以用于企业级应用了。

他们还提到,最新的 2.5 Pro 在 Elmarina (LMSYS Arena) 上的 ELO 分数跳了 24 分,以 1470 分继续领跑排行榜。在 Web Dev Arena(网页开发那方面) 上更是猛涨 35 分,以 1443 分领先。

排行榜数据
排行榜数据

谷歌:我的对手只有我自己。。

排行榜图表
排行榜图表

我还是挺希望2.5 Pro多多更新的,平时用的模型就是他。工程代码当然还是用Claude。

LMSYS Arena - 免费体验高端模型的好地方

对了,关于这个竞技场,大家可以去玩一下。

链接:https://lmarena.ai/

LMSYS Arena 界面
LMSYS Arena 界面

那些需要付费的模型都在里面都可以玩(O3、Claude4 Opus)。只是有一些上下文限制。

模型列表
模型列表

还有一些各大官方没有推出的黑盒模型在里面。

黑盒模型
黑盒模型

Gemini 2.5 Pro

2.5 Pro基本代替了和Chatgpt聊天的位置,一个是AI Studio平台聊天分支称合我心,一个是免费、限制少。图片视频随便传。

编码能力依然强悍,在像 Aider Polyglot 这种高难度编码基准上保持领先。在 GPQA 和 Humanity's Last Exam 这类评估模型数学、科学、知识和推理能力的超难基准测试中,也表现顶尖。

性能基准
性能基准

谷歌还听取了之前 2.5 Pro 版本的反馈,改进了模型的风格和结构。现在它能更有创意,响应的格式也更好看。

新功能:"思考预算"

开发者现在可以通过 Google AI Studio 和 Vertex AI 里的 Gemini API 开始用这个升级版的 2.5 Pro。而且,他们还加了个"思考预算 (thinking budgets)"功能,让开发者能更好地控制成本和延迟。

思考预算功能
思考预算功能
思考预算界面
思考预算界面

Gemini App 今天也开始推送这个更新了。

现在可以给 Gemini 2.5 Pro 设置"思考预算",这挺好的。以前用不了这个功能,有时候成本会很高,现在能控制了,用起来更高效,成本也更有数。

价格依然有竞争力

价格跟以前一样,20 万 token 以内,输入 1.25 美元,输出 10 美元。到 100 万 token 的话,输出涨到 15 美元,输入大概 2.5 美元。

价格信息
价格信息

神秘新模型"Kingfall"现身

此外,谷歌即将推出一款新型号(代号:Kingfall),据报道,它在编码方面甚至比 Gemini 2.5 Pro 更强大。它短暂地出现在 AI Studio 的机密部分下......然后消失了。可能是 Gemini 2.5 Ultra???

Kingfall 神秘模型
Kingfall 神秘模型
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI进修生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • LMSYS Arena - 免费体验高端模型的好地方
  • Gemini 2.5 Pro
  • 新功能:"思考预算"
  • 价格依然有竞争力
  • 神秘新模型"Kingfall"现身
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档