首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek R2 要来了?

DeepSeek R2 要来了?

作者头像
磊叔的技术博客
发布2025-06-09 20:26:25
发布2025-06-09 20:26:25
2361
举报

虽然官方还没正式官宣,但这两天科技圈已经被DeepSeek R2的传闻刷屏了!从X(原推特)到科技论坛,各路消息满天飞——有说这周就要发布的,有爆料技术参数的,甚至还有讨论华为芯片的。咱们来扒一扒这些劲爆消息到底靠不靠谱。

Image
Image

真假难辨的"剧透"信息

4月27日这天简直成了爆料狂欢日。用户@kimmonismus神秘兮兮地说"DeepSeek R2越来越近了",@imjustnewatai更是直接押注"本周必发"。虽然这些消息都挂着"小道"标签,但几个硬核数据还是让行家们坐不住了:

图片
图片
  • • 参数王炸:据说用了1.2万亿参数的混合专家架构(MoE),每次调用激活78亿参数——这相当于给AI装上了可变形引擎,需要时能调动超级算力(@deedydas爆料)
  • • 更低的价格:输入成本砍到每百万token只要7美分,输出也才27美分,比GPT-4o便宜了97%!难怪@Neuralithic直呼这是要"掀桌子"的节奏
  • • 中国芯加持:5.2PB的训练数据全靠华为Ascend 910B芯片撑着,效率居然能达到A100集群的91%,这数据看得@iruletheworldmo都忍不住点赞
  • • 六边形战士:COCO视觉数据集92.4%的得分,推理能力据说能吊打现役冠军选手,@bindureddy表示这要是真的,行业排名又要洗牌了

不过要我说啊,这些猛料看看就好。Wccftech等外媒虽然跟风报道,但连个发布日期都说不准,DeepSeek官微更是安静如鸡。

行业地震正在进行时

别看R2还没露脸,它家前作R1早就把市场搅得天地覆了。今年1月R1发布时,直接让英伟达股价玩了个"跳水17%+反弹9%"的过山车,5890亿市值瞬间蒸发又回来,炒股的兄弟应该记忆犹新吧?

Image
Image

印度IT巨头Zensar的COO说得实在:"DeepSeek这匹黑马,逼得全球大厂都在连夜改PPT。"更绝的是他们用华为芯片这事——明摆着要摆脱美国技术卡脖子,这操作看得业内人士直呼内行。

参数党最爱的对比表

怕你们记不住,贴心整理了个对比清单(数据纯属爆料,请谨慎食用):

型号

发布时间

参数规模

杀手锏

必杀技

R1

2025.1

商业机密

开源还免费!MIT协议真香

直接叫板GPT-4

V3

2025.3升级

6710亿

文本图片视频全拿下

硬件效率吊打同行

R2(网传)

可能本周

1.2万亿核弹

价格低到友商想报警

华为芯+推理视觉双修

写在最后:不管真假,DeepSeek已经赢了

就算R2的爆料最后被"打脸",DeepSeek这套组合拳也够漂亮。从开源生态到硬件替代,从价格战到多模态,DS 明显在下一盘大棋。更别说已经抱上微软、亚马逊这些大腿,全球化布局肉眼可见。有意思的是这些消息 大多都是外国人发布,还一个个说的煞有介事的,细节一个比一个多,怎么中国人自己都不知道这回事?

关键链接参考

  • • Wccftech报道
  • • 华为Ascend芯片详情
  • • COCO数据集排名
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 磊叔的技术博客 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 真假难辨的"剧透"信息
  • 行业地震正在进行时
  • 参数党最爱的对比表
  • 写在最后:不管真假,DeepSeek已经赢了
  • 关键链接参考
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档