在最新公开榜单中,Grok-3 成为首个综合得分突破 1400的大模型,可谓风头无两。不过,拆开各分项指标后,我们可以看到更细致的差异。
在数学领域上:
在科学领域上:
而且,从整体的Grok 3跑出的模型整体分数来看,是 首个超过 1400 分 的模型啊!果然,马斯克吹过的牛都会实现,自家的Grok3在这个分数榜单上确实是史上最强模型。
除了主力模型,Grok 团队还同步推出了轻量推理版本。在相同测试场景下,它也击败了 o3 mini、DeepSeek-R1 以及 Gemini 2 Flash Thinking,展示了不错的实际部署潜力。
官方时间线显示,Grok 系列从 2023 年问世到如今的 Grok-3,用不到两年便追至 GPT-4o 的梯队。需要指出的是,大模型路线已被 OpenAI 率先“趟”出完整范式,后来的团队可以直接站在现有经验与工具链上加速迭代,这也是 Grok 进步神速的重要原因。
Grok-3 直接动用了 20 万张 H100,堆砌算力的力度堪称“土豪级”。然而,业内也开始质疑这种单纯遵循 Scaling Law 的暴力扩容是否还能带来线性收益。
因此,Grok-3 目前可称“最强竞赛选手”之一,但要成为 AI 领域的长期王者,还需要在 性价比 与 创新性 上交出更多答卷。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有