Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >何许人也?敢把大模型价格“打骨折”?

何许人也?敢把大模型价格“打骨折”?

作者头像
科技云报道
发布于 2024-05-20 08:03:13
发布于 2024-05-20 08:03:13
2280
举报
文章被收录于专栏:科技云报道科技云报道
云计算价格战的硝烟尚未散去,全球AI大模型也卷出了“骨折价”。

今年以来,OpenAI、Mistral AI、通义千问、智谱AI、文心一言纷纷祭出降价“撒手锏”。

在海外,法国人工智能企业Mistral AI大模型Mistral Large的输入、输出价格比GPT-4 Turbo便宜约20%。OpenAI推出新一代旗舰AI模型GPT-4o,其API价格下降50%。

国产大模型在降价上也“不甘落后”。通义千问2.5性能基本追平GPT-4 Turbo,个人用户可从App、官网和小程序免费使用。

智谱AI将入门级大模型GLM-3 Turbo调用价格下调80%,1元就可以购买100万tokens。字节跳动豆包大模型开启对外服务,根据火山引擎公布的价格计算,1块钱就能买到豆包主力模型的125万Tokens。

究竟是什么原因引发了大模型这轮波澜壮阔的降价潮?降价后大模型将往何处去?值得我们研究。

全球大模型掀起降价潮

原因几何?

任何技术最终的落脚点都是实用性、易用性和性价比的三者统一,没有例外。

无论是当初的电商、外卖、手机,还是如今的新能源汽车、大模型,当技术发展到一定阶段,竞争到最后都会遵循价格第一的铁律。目前,全球大模型产业不约而同地掀起“降价潮”,也正印证了一个规律:性价比是商业最高真谛,贵不等于值得,划算才是。

在新技术或新产品追求大规模商业化落地过程中,“降价”策略得以使新技术和产品得到最快速度、最大限度的普及,也成为科技企业技术商业化的必然路径。

全球大模型头部企业OpenAI于近日宣布最新GPT-4o多模态大模型,其在保持与GPT-4同等智能水平的基础上,实现了文本、图像和语音处理的全面提升,同时GPT-4o将免费开放给所有用户,整体API价格相比于前代也下降了50%。

事实上,这已不是OpenAI在商业化道路上的第一次降价。以GPT-3.5系列的输入成本为例,2023年3月首次降价90%,6月再次降价25%,到了2024年2月,进行第三次降价50%。

反观国内,以具有代表性的大模型头部企业智谱AI为例,去年6月,在科技媒体The Information的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一,其一举一动在业内具有风向标性质。

智谱AI的大模型开放平台bigmodel.cn于近日上线了全新的价格体系。新注册用户可以获得额度从500万tokens大幅提升4倍,至2500万tokens,入门级产品GLM-3Turbo模型产品的调用价格更是断崖式下降80%,从5元/百万tokens直接降至1元/百万tokens,堪称“价格屠夫”。

我们看来,降价并非简单粗暴的价格战,而是充分释放让利空间,是技术、规模带来的正循环。目前,大模型应用发展仍处于早期阶段。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。而降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

“数据飞轮”在大模型进化过程中的作用不可忽视,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。

通过降价,一方面用户不仅感受到了大模型应用带来的便利和高效,大模型企业还可以更快速地吸引用户,通过用户反馈数据加速大模型迭代升级,另一方面帮助大模型企业抢占市场份额提高营收,以对冲高昂的研发投入,真正实现“技术-场景-盈利”的商业化闭环,同时随着大模型应用场景的开拓,还会衍生出更多的微调及推理等需求,进一步带动国内AI应用的繁荣发展。

从这个角度来讲,大模型降价这事无论对于个人用户还是企业用户都是一种双赢。

大模型迈入“普惠时代”

通过对比通义千问、文心一言、百川、MiniMax、月之暗面等入门级产品API调用价格不难发现,智谱AI此次降价幅度之大前所未有。

价格调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以让更多企业和个人都能用上这款入门级产品。

除了个人版GLM-3Turbo,智谱AI的企业级产品GLM-4/GLM-4V价格尚未出现大幅波动,仍维持在0.1元/千tokens,百万tokens的价格为100元。作为一款能力逼近GPT-4的国内领先大模型,GLM-4这一价格还是具有明显优势。

再与OpenAI价格进行对比,其最新模型GPT-4 Turbo每100万tokens输入/输出价格分别是10/30美元。Claude 3 Opus则更贵,每百万tokens输入/输出价格15/75美元。

在这轮降价潮中,我们可以隐约看到“摩尔定律”也在深深影响着大模型行业。伴随大模型价格下降的是性能的大幅提升。

今年3月,清华大学基础模型研究中心联合中关村实验室发布的《SuperBench大模型综合能力评测报告》显示,GLM-4已然闯入第一梯队,与GPT-4、Claude-3等国际一流模型水平接近,且差距已经逐渐缩小。

2023年3月,智谱AI推出千亿开源基座对话模型ChatGLM系列,并在过去一年内完成4次升级,于2024年1月推出新一代基座大模型GLM-4系列,整体性能相比上一代提升了60%,已经逼近GPT-4。

它能够支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,逼近DALLE-3。

为进一步降低大模型使用门槛,智谱AI推出智能体定制功能,用户只需使用简单的提示词指令,就可以创建属于自己的智能体。

任何人都可以自由运用GLM-4模型,即使没有任何编程基础,也能便捷地进行大模型开发。正是得益于GLM模型的强大的智能体能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂指令,从而完成更加复杂的任务。

技术的持续进步为降低开发大模型成本提供了现实可能。智谱AI通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现,以及精细化集群调度等技术,将GLM-3 Turbo推理成本进行大幅压缩。

自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,已累计降价超过百倍,这无疑也给了智谱AI将API调用价格打至“冰点”的底气。

一直以来,大模型给外界的印象是贵、小众。事实也确实如此,在行业发展初期,由于还未形成规模效应,厂商的成本一直居高不下,很多企业和开发者只能望洋兴叹。

但智谱AI等大模型厂商此次调价向行业和公众宣告这样一个事实:优质的大模型,不一定要花大价钱,“技术普惠时代”已经到来。

所谓的“技术普惠”,就是坚持致力于突破技术壁垒,让更多前沿科技以大众更能接受的价格走进生活,让更多人有机会享受到科技带来的便利。

“强性能+好价格”是技术普惠的最大特征,智谱AI正在沿着这条路前行,其开放平台上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日的token消耗增长超过一百倍。

比如官方开发的三个调用工具,网页检索、函数调用以及知识库,自从1月上线以来调用次数已经超过3亿次。

智谱AI CEO张鹏曾表示:“虽然目前技术已经非常快速地在呈现,但仍有很多问题值得去探索。智谱着眼于通用人工智能(AGI),这里的每一个问题的突破都有可能实现飞跃式发展,我们还远未达到技术的天花板,但曙光已现,2024年是向AGI发起冲锋的起始年份。”而此轮凌厉的降价,预示着智谱AI吹响了向AGI发起冲锋的号角。

商业化先行者已立潮头

虽说大模型这两年很火,但质疑之声仍不绝于耳。

其中一个很重要的原因,就因为现阶段做大模型每天的投入可能成百上千万,但很多的产品目前商业化程度并不高,有点像“砸钱赚吆喝”。

虽然“高投入”依然是主流大模型赛道玩家的主色调,但近两年,基础大模型及上层应用服务商的盈利能力明显在增强。同时,大模型应用在C端涌现出了不少现象级产品,但很多仍处于以免费模式获客到商业转化的阶段,营收规模并不突出。

在这其中,OpenAI较早开始商业化尝试,2022年对外的营收是2800万美元,2023年ARR增至16亿美元,激起了业内的无限联想。不过,OpenAI爆发式的营收增长和其丰富的业务线、市场占有率、以及B端、C端的双布局也有很大关系。

对比国外,国内企业级大模型服务的渗透更快,发展势头也更猛。在B端需求井喷以及客户群较高的付费能力的推动下,《中国AIGC应用全景报告》预测,国内AIGC应用市场2024年底有望增至200亿规模,预计2030年可达万亿规模。

从目前来看,底层通用大模型赛道多采用开放API接口的形式,扩大客群,最终按实际消耗或调用的tokens量收费。对于主流的大模型应用来说,按订阅费、调用费以及定制化收费显得更常见。

比如OpenAI的另一条业务线DALL-E 3,虽然没有公布明确的商业计划,不过它更多向ChatGPT的付费版/企业版用户开放,充分放大了ChatGPT会员订阅的吸引力。

反观智谱AI,其大模型开放平台bigmodel.cn,被视为公司今后大模型应用和商业化的重要接口之一,其平台生态也日益壮大。截至目前,智谱AI已有超过2000家生态合作伙伴、1000家规模化应用和200家深度共创客户。

通过采用降价策略,智谱AI率先抢占市场一角,吸引大量企业和开发者对API的调用,当企业和开发者形成平台粘性后,实现大规模营收也就是顺理成章的事情了。

在大模型的激烈竞争中,智谱AI率先拿起“价格屠刀”,无疑将带给行业不小的压力,但也加速了整个行业的商业化进程。

对于大模型厂商而言,价格战既是压力也是前进的动力,但对于企业和开发者而言,则是实实在在的利益和价值,有助于加快大模型行业应用创新落地。

但最终市场蛋糕能做多大,将取决于能否落地合适的业务场景,打造商业闭环,同时也是对大模型应用服务商自身的产品和服务实力的深度考验。

可以预见的是,未来大模型一定是技术、成本、性价比三者的平衡,国内大模型厂商通过不断在B端和C端进行持续探索,将为大模型打通商业化闭环提供了切实可行的路径。尽管前路挑战重重,但随着技术的普惠发展,我们相信,大模型全民普及时代正加速到来,一个充满机遇和创新的新纪元已为时不远。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技云报到 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大模型发展历程:技术演进与趋势洞察
本文系统梳理了 2017 年至 2025 年间,大语言模型(LLM)领域的关键进展、技术演进和代表模型。从 Transformer 架构的革命性突破,到 GPT-3 的规模化成功,再到多模态模型的兴起,大模型技术正在重塑人工智能产业格局。
磊叔的技术博客
2025/06/08
7650
大模型发展历程:技术演进与趋势洞察
百万tokens低至1元!大模型越来越卷了
在刚刚举行的 ICLR 2024 大会上,智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势,同时预告了GLM的后续升级版本。 今天,智谱大模型开放平台(bigmodel.cn)上线了新的价格体系。入门级产品 GLM-3 Turbo 模型调用价格下调80%!从5元/百万tokens降至1元/百万tokens。1元可以购买100万tokens。 调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以让更多企业和个人都能用上这款入门级产品。
机器之心
2024/05/14
5590
百万tokens低至1元!大模型越来越卷了
价格战之后,智谱来到商业化的下一站
这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表。
AI科技评论
2024/06/17
1670
价格战之后,智谱来到商业化的下一站
新火种AI|这家“中国OpenAI”,能赶超OpenAI吗?
在OpenAI首次DevDay发布GPT-4Turbo、GPTs应用商店等的两个月后,GPT store刚刚上线后,1月16日,国产大模型迎来了第一个重磅消息。被称为“中国OpenAI”的智谱AI,在其技术开放日Zhipu DevDay上,正式发布了新一代基座大模型GLM-4。
新火种
2024/01/18
2360
新火种AI|这家“中国OpenAI”,能赶超OpenAI吗?
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
今天上午,在 AI 开放日上,备受关注的大模型公司智谱 AI 公布了一系列行业落地数字:
机器之心
2024/06/17
1.2K0
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
AI日报|智谱AI再降价,同时开源9B系列模型;国内外气象大模型竞逐升级
AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU
可信AI进展
2024/06/07
1450
最接近GPT-4的国产大模型诞生了
在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。
机器之心
2024/01/17
3710
最接近GPT-4的国产大模型诞生了
在 ICLR 2024,看见中国大模型的力量
近日(5.7-5.11),第十二届国际学习表征会议(ICLR)在奥地利维也纳的展览会议中心召开。
AI科技评论
2024/05/14
3380
在 ICLR 2024,看见中国大模型的力量
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
我们来看一个非常经典的案例:只需要输出你想讨论的话题,AI 就能自动去小红书、知乎等平台上深度查询、总结完整报告,并转化为面向大众的传播内容。短短 14 天里,AI 孵化出了一个 5000 多个粉丝的小红书账号,还接到了商单。
机器之心
2025/04/01
2700
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
“AI 六小虎”首个 IPO 来了!大模型狂奔两年后,开源成“唯一出路”
智谱被曝启动上市备案,但六小虎胜者未定。“AI 六小虎”是过去两年国内大模型时代的一个标志,指的是当年最早完成 10 亿 + 美元融资,且均拥有自研千亿参数级大模型,在国际基准测试中与 GPT-4、Llama 等对标的大模型创业公司。
深度学习与Python
2025/04/16
840
“AI 六小虎”首个 IPO 来了!大模型狂奔两年后,开源成“唯一出路”
中国 VC 谈大模型:AGI 是「理想国」,还是「乌托邦」?
再深入追问,概括起来就是一句话,「大环境变了」。主要体现在两方面,一方面是「中国市场没钱了」,另一方面是「美元基金逐渐退出中国市场、即使投也会变得非常挑剔」。
AI科技评论
2024/06/03
2230
中国 VC 谈大模型:AGI 是「理想国」,还是「乌托邦」?
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4(11月6日最新版本效果)。
量子位
2024/01/17
2120
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
“大模型的 Scaling Law 并未失效,AI 技术的增长进入了一个全新的阶段。也就是说大模型技术的创新依旧是突飞猛进的进行时,甚至还有速度越来越快的迹象。”智谱 AI CEO 张鹏在 6 月 5 日的 Open Day 上说道。
深度学习与Python
2024/06/17
2330
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
“我们的模型表现超过了其他模型,欢迎不认同的友商来 LMSYS 打擂台,证明我是错的。但在那发生之前,我们会继续说我们是最好的模型。”李开复在 5 月 21 日的分享会上说道。
深度学习与Python
2024/05/23
980
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
智谱 AI 狂飙:与商业化博弈的一年
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。
AI科技评论
2024/03/18
5280
智谱 AI 狂飙:与商业化博弈的一年
智谱AI推出GLM-4,性能逼近ChatGPT-4
随着人工智能技术的持续发展,神经网络的参数数量已经从Alexnet的6000万个增长到OpenAI GPT-3的1750亿个,人工智能已进入大模型时代。ChatGPT、GLM-4、Claude3等大模型不断涌现,本文将详细介绍智谱AI所推出的GLM-4大模型,分析其背景、性能、应用等。
存内计算开发者
2024/06/14
7581
智谱AI推出GLM-4,性能逼近ChatGPT-4
独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来
作为当前国内最受欢迎的开源大模型之一,智谱AI开源非常早,是国内大模型的开源先锋。
AI科技评论
2023/11/22
2.8K0
独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来
大模型“六小虎”的2024:大厂强势,蹊径难寻
【编者按】以变革应对变局,以远见超越未见。四木相对论 、大象新闻、大象财富联合腾讯新闻、腾讯财经、腾讯科技推出2024年终策划《变局之下》,回望2024、展望2025,让洞见穿越时间,向未来寻求确定。
小腾资讯君
2024/12/30
1960
2024 年,谁能成为中国大模型的 F4?
从大模型这个新物种涌现出来的智能能力看,人们愿意相信,它可能会颠覆原有的生产生活方式,甚至会推动科技、经济向前发展一大步。于是,以百度、阿里、华为代表的大厂纷纷押注,进军大模型赛道,并很快研发出了文心、千义通问、混元、盘古等大模型,并持续迭代创新。
AI科技评论
2024/02/27
6500
2024 年,谁能成为中国大模型的 F4?
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
刚刚,智谱推出最新的 AutoGLM 沉思模型,不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator)。并且,这个会“边想边干”的智能体还能自己接单赚到钱。
深度学习与Python
2025/04/05
1520
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
推荐阅读
大模型发展历程:技术演进与趋势洞察
7650
百万tokens低至1元!大模型越来越卷了
5590
价格战之后,智谱来到商业化的下一站
1670
新火种AI|这家“中国OpenAI”,能赶超OpenAI吗?
2360
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
1.2K0
AI日报|智谱AI再降价,同时开源9B系列模型;国内外气象大模型竞逐升级
1450
最接近GPT-4的国产大模型诞生了
3710
在 ICLR 2024,看见中国大模型的力量
3380
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
2700
“AI 六小虎”首个 IPO 来了!大模型狂奔两年后,开源成“唯一出路”
840
中国 VC 谈大模型:AGI 是「理想国」,还是「乌托邦」?
2230
国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
2120
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
2330
李开复:不参与“价格战”、模型盲测国内第一欢迎 PK
980
智谱 AI 狂飙:与商业化博弈的一年
5280
智谱AI推出GLM-4,性能逼近ChatGPT-4
7581
独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来
2.8K0
大模型“六小虎”的2024:大厂强势,蹊径难寻
1960
2024 年,谁能成为中国大模型的 F4?
6500
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
1520
相关推荐
大模型发展历程:技术演进与趋势洞察
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档