全文概览
生成式人工智能的浪潮席卷全球,企业纷纷加大投入,希望在这场技术革命中抢占先机。云厂商和主权国家每年投入数千亿美元的资本支出,似乎预示着AI的无限前景。然而,在这股狂热的投资背后,一个令人困惑的现象正在显现:尽管AI预算持续火热,整体IT支出却显得不温不火,甚至预期有所下调。
企业真的从AI投资中获得了预期回报吗?报告显示,AI项目的实际回报并不高于,甚至可能落后于传统的IT项目。地缘政治动荡、政策不确定性以及低迷的GDP预测,共同构成了复杂的宏观环境,使得买家对技术支出的预期趋于谨慎。
本文将深入探讨当前企业AI采用的真实数据,结合整体IT支出情况,分析AI使用中的动态变化,并展示一些前沿的AI产品研究。宏观经济的逆风是否会吹散AI的投资热情?企业又该如何在不确定性中找到AI落地的方向?让我们一起探寻这些问题的答案。
阅读收获
深度分析 作者:Dave Vellante 和 Erik Bradley[1]
生成式人工智能觉醒已过去三十个月,企业从AI投资中获益多少,目前尚无定论。
尽管绝大多数客户仍在持续投入AI,但报告的回报并不高于,坦率地说,甚至落后于通常与历史信息技术项目相关的回报,例如企业资源规划(enterprise resource planning)、数据仓库(data warehousing)和云计算(cloud computing)。让我们面对现实,云厂商和主权国家每年数千亿美元的资本支出正在助长这种狂热情绪,并实质上支持了对AI运动的盲目信仰。
但企业采用AI的实际回报仍然不透明。再加上地缘政治动荡、波动的公共政策以及低个位数的GDP预测,买家正在调低对技术支出的预期,相对于今年1月份而言。
在本期深度分析中,我们将结合整体IT支出情况,回顾企业AI采用的最新数据。我们还将深入探讨AI使用的一些动态,并为您简要展示Enterprise Technology Research进行的一些前沿AI产品研究。
我们认为,ETR最新一期的AI产品系列数据(如下所示)证实了预算正果断转向构建内部AI应用。
这项针对600位积极开发和维护专有AI应用的IT决策者的调查发现,83% 的受访者预计2025年将增加支出,其中大多数预计将实现两位数增长。只有5% 预计会出现任何回落。ETR指出,1月份针对更广泛的“购买和构建”AI项目进行的配套调查也显示出类似的看涨解读(75%净积极),这强调了无论企业是购买软件即服务还是自行编写代码,AI应用/开发都是预算重点。
尽管如此,在我们看来,图表中响应的右偏分布表明市场仍处于加速模式,远未饱和。这意味着为内部AI团队提供工具、运行时平台和人才的供应商可能会在2026年及以后看到持续的顺风。
下方的图表描绘了一幅画面,表明地缘政治紧张和不断变化的政策框架并未阻碍企业AI议程。在ETR 2025年4月对507位领导者进行的宏观调查中,半数受访者表示,尽管政策收紧,他们仍在维持或加速AI项目。只有10%的受访者正在放缓脚步。
上方的横条描绘了三个群体:1) 加速采用AI的企业;2) 维持现状的企业;3) 放缓采用的企业。
中间的条带标记为“谨慎推进”,占比最大,约为40%,而减速部分则低于10%。当数据过滤IT-电信行业的受访者时,代表加速的最左侧条带显著加宽,从24%跃升至40%,“持续”类别也相应提升至26%。在我们看来,这些数据强化了数字密集型行业正在加倍投入,而非对冲的观点。
在我们看来,图表的不对称性——即大部分是“绿色”,只有狭窄的“红色区域”——表明AI在2025年预算中赢得了突出地位。谨慎的中间群体将随着监管护栏的巩固而转向加速;如果持续不确定,则会维持现状。我们提醒,支出是反复无常的,常常随经济情绪起伏。
下方的图表给原本看涨的叙事注入了警示。生成式AI浪潮已过去三十个月,27%的受访者承认他们尚未看到其AI支出的任何实际回报。不到10%的受访者报告ROI超过25%,这是许多CFO用来批准高风险IT项目的门槛回报率。更具启发性的是,超过四分之一的受访者承认他们根本没有追踪ROI。
上方的条形图段显示了几个ROI区间,包括未追踪、负/零、0-10%、10-25%以及三个“>25%”区间。最大的群体要么没有衡量,要么尚未达到盈亏平衡。这些数据强调了结果偏向于未经证实或未经衡量。
我们再次看到数据中的不对称性——即“无回报”的群体很大,而在“高回报”处急剧减少。在我们看来,这表明AI仍然是一个早期周期的投资故事。我们之前强调的“谨慎推进”中间群体一旦实际效益显现,可能转向积极;反之,如果ROI持续落后于预期或经济情绪转变,则可能恶化。无论如何,接下来的两轮调查对于确定乐观情绪是否能转化为可衡量的经济价值至关重要。
我们认为,下方的图表提供了一个重要的现实检验。当被问及如果宏观经济状况进一步恶化,他们会从哪里削减资金时,219位C级高管表示,AI项目被列为第二大“非常脆弱”的类别——仅次于外包IT服务,排在安全云、软件即服务和核心基础设施之后。
上方的横条按评估各领域增量削减脆弱性的高管比例对七个IT领域进行排名。外包IT服务位居榜首,其次是AI项目。安全性风险最小,位居末尾,而云计算、SaaS和基础架构占据中间位置,这表明它们相对更不受影响。
观察 | 启示 |
---|---|
三分之一的C级领导者现在预计2025年的支出将比最初计划的减少更多。 | 可自由支配的项目将面临优先排序,迫使AI团队根据更清晰的ROI基准来证明项目的合理性。 |
AI的沙盒状态使其成为一个便捷的目标。 | 与网络防御或生产工作负载不同,AI试点项目可以暂停,而不会危及日常运营,使其成为CIO在政治上安全的削减对象。 |
安全性仍然受到最大程度的保护。 | 我们的研究表明,合规要求和安全漏洞新闻继续保护安全预算,即使在收紧周期中也是如此。 |
云和基础设施以及软件享有中等程度的保护。 | 这些类别支撑创收的数字服务;因此,直接削减可能导致收入流失。 |
速度可能适得其反。 | AI支出增长的速度本身就招致审查——当被迫控制现金消耗时,控制者看到了一个明显的杠杆。 |
关于削减风险的利弊权衡
在我们看来,这些数据提醒投资者和从业者,AI炒作不等于预算免疫。虽然早期数据显示了强劲的投资意向,但上方呈现的C级高管观点突出了一个警告。具体而言,如果宏观逆风加剧,实验性AI资金可能成为首批被削减的对象。
下方的数据捕捉到了自最初COVID冲击以来企业技术支出最剧烈的单季度重置之一。ETR 4月份的宏观脉搏显示,2025年IT预算增长预期从1月份的5.3%骤降至3.4%,下降了190个基点,ETR将其描述为“我们在危机之外记录到的最大跌幅”。
上方的折线图追踪了IT总预算增长的连续季度修正,并标注了关键细分领域。所有三条曲线在第一季度和第二季度之间都急剧向下倾斜。主线平均值降至3.4%,而财富500强和全球2000强甚至更不乐观,分别预期为2.4%和2.2%。一个脚注是,调查在宣布对等关税后一天结束,这意味着数据错过了随后的股市抛售,这很可能会进一步压低预期。样本采集也在关税暂时搁置后出现的V型反弹之前。
观察 | 启示 |
---|---|
自2020年初以来最大的季度下调。 | 我们的研究表明,随着GDP预测跌破1%且降息仍遥不可及,情绪已果断转向谨慎。 |
规模放大了痛苦。 | 大型企业——历来是IT需求的主要动力,正在进行最深度的削减,这强调了广泛的勒紧裤腰带,而非孤立的项目延迟。 |
与GDP的相关性依然存在且显著。 | 与技术支出脱离宏观周期的观点相反,这些数据强化了商业前景与IT支出之间的紧密联系。 |
安全性保持粘性,AI尚可(目前)。 | 正如我们在第四节中指出的,实验性AI仍然脆弱,而维持运营的类别(安全性、SaaS和核心基础设施)享有相对保护。 |
关注7月份的读数。 | 温和的市场反弹可能会提振下一次调查,但我们认为CFO在将预算恢复到5%以上的增长轨道之前,要求更清晰地阐明ROI。 |
关于IT预算预期的利弊权衡
在我们看来,数据明显的下行拐点传达了两个信息。首先,后COVID时代“高个位数基线”的IT增长暂时结束;预算已回落到疫情前的常态。其次,宏观情绪的严重性显而易见。如果GDP保持在1%以下,我们预计CFO将继续将支出重新调整到2%至3%的区间,迫使AI倡导者更快地证明价值,否则将面临资金流失的风险。
以下数据显示,政治和贸易动荡正开始渗透到高管决策中,这是迄今为止最清晰的信号。在对219位C级别高管进行的快速调查中,71% 承认采取了某种形式的收缩,无论是延迟、缩小范围、暂停还是彻底取消AI计划,而只有27% 表示不确定性促使他们加速或批准新项目。
观察 | 影响 |
---|---|
影响在高层真实存在。 近一半的C级别受访者将政策波动与行动联系起来,其中四分之三的行动是防御性的。 | 我们的前提是,除非且直到ROI变得更清晰,否则如果外部环境转为负面,企业对AI的热情将受到董事会层面的限制。 |
延迟多于取消。 大多数高管选择暂停而非“停止”,这意味着如果情况明朗,被压抑的需求可能会反弹。 | 供应商应为第二季度至第三季度交易完成的“气穴”做好准备,并可能在年底出现追赶性激增。 |
预算后置。 与先前的分析[2]一致,支出预期正向第四季度漂移,反映了IPO市场的犹豫不决。 | 我们认为预测模型应比历史季节性建议的更侧重第四季度。 |
沙盒认知持续存在。 实验性AI比创收型工作负载更容易被搁置,这强化了前一节关于AI脆弱性的观点。 | 团队应将试点项目重新定义为成本节约或收入驱动因素,以摆脱“可有可无”的状态。 |
IT项目支出的得失
在我们看来,图表中偏向延迟和缩小范围的不对称分布,凸显了董事会对AI变革潜力的乐观态度与CFO在不稳定宏观环境下的谨慎态度之间日益紧张的关系。下一波调查将揭示今天的暂停是会变成明天的取消,还是仅仅是政策逆风消退后即将释放的蓄势待发。
ETR关于企业计划将哪些基础模型系列整合到其自身代码库中的首次快照提供了一个早期但具有说服力的信号——即,OpenAI的GPT拥有前所未有的关注度,约62%的开发者已经在使用或计划使用该模型。 没有竞争对手能突破35%的界限,这突显了GPT的先发优势和微软通过Azure OpenAI Service获得的渠道优势。
水平条形图显示了十多个模型系列,按“当前使用/计划使用”的份额从高到低排列。GPT的条形图几乎占据了图形的三分之二,实心绿色表示正在使用,带图案的绿色表示近期意向。与此同时,下一组(Gemini、Anthropic Claude、Llama等)徘徊在20%到30%的高低区间。随后是逐渐减少的长尾,Databricks的DBRX、亚马逊的Nova、Snowflake Arctic、DeepSeek、Grok、IBM Granite和Cohere各自的兴趣度较低但值得关注。
应用/开发信号 | 重要性 |
---|---|
62%倾向于GPT | 我们的研究表明,品牌、感知质量和无缝的Azure访问相结合,为OpenAI带来了广泛的企业概念验证机会。 |
中层市场拥挤但可行 | Gemini、Claude和Llama表明,高质量的替代方案已经吸引了相当一部分少数用户,特别是在涉及数据主权、开放性要求或成本限制的情况下。 |
数据平台原生模型上榜 | Databricks和Snowflake尽管推出较晚,但仍进入了领先者行列,这验证了靠近受管数据可以弥补模型规模劣势的论点。 |
专业模型目前仍是小众 | DeepSeek、Grok、Cohere和IBM Granite目前总体上远低于领先者,但它们各自瞄准了空白领域,如RAG优化、私有部署或垂直领域微调。 |
感知到的差异性不大 | 72%的受访者认为模型之间的质量差距“只有很小”,这表明价格、治理和生态系统工具将决定下一轮份额转移。 |
LLM在应用/开发中采用的得失
在我们看来,图表中从GPT到“其他所有模型”的急剧下降证实了在企业竞争中,分发和开发者体验与原始模型性能同样重要。然而,九个替代模型系列的存在,其中许多直接嵌入在数据平台中,预示着一旦基线准确性趋于一致,将进入一个碎片化和价格竞争的新阶段。
我们认为,以下数据说明了一个熟悉的模式——即,企业在AI堆栈中向上移动得越远,微软的主导地位就越强。当被问及他们正在使用或计划使用哪些开发平台来构建AI应用时,三个Azure产品占据了前三位。
排名 | 平台 | “正在使用/计划使用”份额 | 评论 |
---|---|---|---|
1 | Azure OpenAI Service | 60%出头 | 直接通往GPT的管道推动快速概念验证 |
2 | Azure Machine Learning | 50%出头 | 深度集成Databricks,自动化MLOps |
3 | Azure AI Studio | 50%中段 | 用于视觉、语音和RAG的低代码连接器 |
微软在开发平台中的主导地位
紧随微软的主导地位之后,下图显示亚马逊的Bedrock(30%中段)和SageMaker(30%低段)构成了第二梯队,随后是谷歌的Vertex AI(30%区间)。图表以混合的长尾收尾,包括Hugging Face、LangChain、Databricks Mosaic AI、Snowflake ML/Cortex、IBM watsonx、Oracle AI、Cloudflare Workers AI、Red Hat OpenShift AI和H2O.ai。
Note
从数据平台初创公司的数量、能力来看,国内企业在AI领域的应用创新,除了算力短缺的客观短板外,在基础土壤上也有较大差距,软件工程造成的平台能力将是一段时间内需要弥合的关键。
在我们看来,数据强调了一个双重结论:1)微软从模型到工具的端到端定位正在奏效;然而2)市场远非赢家通吃,因为数据主权、延迟和现有平台承诺迫使企业采用多样化的工具集。 能够满足客户数据所在地的需求——同时抽象化模型编排复杂性的供应商,将在AI堆栈演进过程中获得巨大的优势。
我们认为,以下数据表明向量搜索已多么迅速地从头条创新转变为必备功能——以及这种转变如何导致采用分散到令人惊讶的广泛供应商中。当被问及他们目前正在使用或计划使用哪些向量搜索引擎时,受访者将微软的Azure AI Search放在首位,紧随其后的是MongoDB的原生Atlas Vector Search,而Elasticsearch和Redis几乎并驾齐驱。第二梯队包括谷歌的Vertex AI、亚马逊Kendra、Databricks的Vector Store、Snowflake Arctic Vector和Oracle的OCI AI Search,占据了十几百分比的份额,随后是IBM watsonx.data(IBM使用Milvus) 以及Pinecone、Milvus和Cloudflare Workers AI等专业独立产品,构成了个位数意向的长尾。
信号 | 影响 |
---|---|
向量搜索的功能化。 | 该技术现已成为必备功能;差异化转向延迟、规模和与数据治理的集成。 |
微软位居榜首,但优势微弱。 | 数据表明,当企业已承诺使用GPT/Azure时,他们会默认选择Azure AI Search,但优势很小,这证明了切换成本低。 |
MongoDB的文档+向量模型引起共鸣。 | 早期的(预发布)评价转化为强烈的意向,验证了对于许多工作负载而言,靠近操作数据胜过专业的点解决方案。 |
Redis是隐形攀升者。 | Redis的高排名令许多人惊讶,这表明内存性能对于实时个性化是一个引人注目的利基市场。 |
Elastic通过统一搜索保持相关性。 | Elasticsearch的可观测性足迹为其提供了日志分析和安全遥测的内置向量用例。 |
专业供应商必须证明价值。 | Pinecone、Milvus和Cloudflare吸引了实验性使用,但必须在多租户隔离、混合部署或成本效率方面实现差异化才能向上攀升。 |
向量嵌入的得失
在我们看来,数据证实向量搜索已经跨越鸿沟进入“必备”领域,但远非赢家通吃。企业仍在通过询问“哪个引擎适合我现有的数据拓扑和延迟SLA?”来评估选项,而不是默认选择单一的云产品。我们预计整合将沿着两条路径进行:1)将向量索引更深入地嵌入主流数据库;2)专业引擎瞄准高吞吐量、跨区域的检索增强生成(RAG),并降低成本。
垂直条形图从左到右排列这些障碍。前三个条形——技能、数据质量、遗留系统集成——远高于其余部分,随后是合规性、预算和扩展性等中间部分,然后是文化等软因素的逐渐减少。
数据突显了大型企业发现自己动手构建AI比营销演示暗示的要困难得多。在针对构建自身应用的组织进行的600名受访者数据分析中,如下图所示,一些障碍尤为突出,其中以技能、数据质量和集成挑战为首。
在我们看来,数据突显了一个清晰的事实——即,AI的限制因素更多地在于企业的基础设施,而非技术突破。解决数据卫生、技能获取和遗留系统连接问题,对于采用速度而言,将比从下一个模型版本中每美元多榨取几个token更重要。
我们认为,以下数据验证了本研究报告贯穿的核心主题——即,大多数企业正在将其AI资产进行分化,将敏感工作负载保留在靠近数据的地方,而将其他一切都卸载到公有云。
在我们看来,图表清晰地呈现了正在出现的 “将AI带到数据所在地” 的论述。公有云的敏捷性在快速原型开发方面仍然无与伦比,但注重主权的行业拒绝将数PB的敏感数据复制/移动到其他区域。能够在任何地方(超级云)——例如,公有区域、托管机笼、数据中心机架或工厂车间——提供类似云体验的供应商,将抓住下一波企业支出。使本地AI像SaaS一样易于部署,同时保留董事会现在要求的治理保障,这场竞争正在进行中。
我们认为,以下数据证实,生成式AI点燃了自PC-服务器时代以来最大规模的单一用途基础设施繁荣。堆叠面积预测图——分为深蓝色“云端AI” 和浅蓝色“企业本地AI”——显示,AI专用数据中心总支出(计算、存储、网络、电力和冷却)将从2023年的约430亿美元跃升至2024年的1800亿美元,并在2025年超过2500亿美元,开启了我们称之为数据中心超级周期的阶段。
我们的模型预测,到2034年,AI数据中心建设的10年复合年增长率(CAGR)为24%,但企业本地部署的复合年增长率甚至更快,达到40%。我们估计,到2030年,本地AI数据中心基础设施将超过1000亿美元,超过目前通用数据中心设备的整体规模,并开辟一个可与早期超大规模云支出模式相媲美的市场。重要的是,这一预测不包括SaaS消费,这突显了在计算任何订阅费用之前,物理基础设施的总潜在市场(TAM)是多么巨大。
观察 | 影响 |
---|---|
2024年1800亿美元的阶跃式增长是由英伟达驱动的GPU集群、辅助电力/冷却、网络和存储推动的。 | 我们的研究表明,极端并行处理(EPP)几乎在一夜之间从“数百亿美元”跃升至“数千亿”,验证了超级周期的论述。 |
云目前仍占主导地位,但企业支出的斜率更陡峭。 | 数据引力、延迟和主权正迫使银行、保险公司和制造商在其自身防火墙后复制AI工厂。戴尔、HPE和Supermicro将是主要设备供应商。 |
构建和购买并存——目前如此。 | 企业同时许可代理型SaaS(例如,Salesforce Agentforce,ServiceNow Now Assist)并构建定制模型;这两种流程最终都将落在超大规模云基础设施上,并扩大深蓝色区域。 |
决策点迫近。 | ETR指出,一旦模型稳定且ROI明确,CFO最终将在永久性SaaS费用和自营堆栈之间做出选择。 |
GPU即服务和托管成为关键摇摆因素。 | CoreWeave式的公用事业服务无需全额资本支出即可实现突发容量,模糊了公有云和私有数据中心经济性之间的界限。 |
机器人浪潮尚未体现在图表中。 | 黄仁勋的第三个向量——物理机器人和远边缘的AI——超出了本预测模型范围,这意味着尚未建模的额外上行空间。 |
延伸思考
这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
#CubeInsight #企业IT投入分析
原文标题:AI budgets are hot, IT budgets are not
Notice:Translate by Gemini-2.0-flash-thinking