首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta豪掷600亿布局AI,DeepSeek低成本高效能引发业内焦虑?

近日,科技巨头meta Platforms, Inc.宣布,即便面临中国人工智能(AI)初创企业DeepSeek发布的低成本高效能模型带来的挑战,公司仍计划在2025年维持其高额的研发投入。这一决定引发了业界对AI技术持续巨额投入的广泛讨论。

meta首席执行官马克·扎克伯格上周五在Facebook上发帖称,尽管AI研发任务艰巨,meta仍计划在2025年投入600亿至650亿美元用于资本支出(Capex)。这一数字远超华尔街预期的513亿美元,与分析师预测的约380亿美元年度Capex相比增长了近58%,更是2023年支出的两倍多。

扎克伯格将2025年称为“AI的决定性一年”,他期望meta AI能成为服务超过十亿人的领先助手,开源模型Llama 4能成为最先进的领先模型,并推出AI工程师,为公司研发工作贡献越来越多的代码。

为实现上述目标,meta正在建造一座2吉瓦(GW)以上的数据中心,该中心将覆盖曼哈顿的很大一部分。扎克伯格表示,meta将在2025年上线1吉瓦的计算能力,年底时图形处理单元(GPU)的数量将超过130万个。

除了高达650亿美元的2025年Capex计划外,扎克伯格还表示,meta将在今年大幅扩大其AI团队,并补充说,公司有资金在未来几年继续投资。

然而,尽管有着雄心勃勃的支出计划,面对DeepSeek带来的新挑战,meta似乎陷入了恐慌模式。DeepSeek的AI模型能以更低的成本提供与主流产品相当的性能。据《The Information》周末报道,包括AI基础设施总监马修·奥尔德姆在内的meta AI团队领导最近担心,DeepSeek开发的新AI意味着meta在AI竞赛中落后了。这些领导者担心,meta即将发布的下一代旗舰AI模型Llama的表现可能不如DeepSeek的模型。据该美国科技新闻媒体报道,meta已设立多个“作战室”,即专门的研究小组,来剖析DeepSeek,并利用这些见解来改进Llama。

据报道,meta的生成式AI团队和基础设施团队已启动了四个作战室,以了解DeepSeek的工作原理。其中两个作战室正在试图理解DeepSeek的创始人兼支持者High-Flyer是如何降低DeepSeek的训练和运行成本的,因为meta希望将这些技术应用于Llama。第三个作战室正在试图弄清楚High-Flyer可能使用了哪些数据来训练DeepSeek模型,而第四个作战室则正在权衡基于DeepSeek同类模型属性的新技术来重构meta模型。

在Team Blind这个由数百万专业人士用来寻求和分享建议的匿名论坛式社交媒体应用程序上,一篇帖子也反映了meta内部报告的恐慌情绪。一名meta员工在帖子中表示,DeepSeek的V3模型让整个生成式AI团队陷入了恐慌模式,而“这家拥有550万训练预算的未知中国公司”更是雪上加霜。

“工程师们正疯狂地试图剖析DeepSeek,并从中学到我们能学到的一切。我甚至没有夸大其词,”该员工说,“管理层担心如何为生成式AI组织的巨额成本辩护。当生成式AI组织的每一位‘领导’的收入都超过了训练DeepSeek V3的全部成本,而我们又有几十位这样的‘领导’时,他们该如何面对领导层呢?”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OFNSJ8mas0ioM4wEE6agK7Jw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券