首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >BIS白皮书:AI供应链的五个层级

BIS白皮书:AI供应链的五个层级

作者头像
AIGC部落
发布2025-09-30 15:06:25
发布2025-09-30 15:06:25
2360
举报
文章被收录于专栏:Dance with GenAIDance with GenAI

作者:Leonardo Gambacorta 和 Vatsala Shreeti,2025年3月

国际清算银行(BIS)2025 年报告指出,AI 发展依赖由硬件、云基础设施、训练数据、基础模型、AI 应用构成的复杂供应链,各层级市场结构差异显著

一、研究背景与目的

人工智能(AI)的快速发展依赖于一个复杂的多层次供应链,包括硬件、云计算、训练数据、基础模型和终端应用五个关键层级。本文系统分析了每一层的市场结构、经济驱动因素及大型科技公司(Big Tech)在其中日益增长的影响力,并探讨了由此带来的竞争、创新、韧性、网络安全和金融稳定等方面的政策挑战。

二、AI供应链的五个层级

层级

关键组成

市场特征

硬件

GPU、ASIC、FPGA等AI芯片

高度集中,英伟达(Nvidia)占据超90%市场份额,配套CUDA生态系统形成锁定效应

2. 云计算

IaaS、PaaS、SaaS服务

全球由AWS(31%)、微软Azure(24%)、谷歌云(11%)主导,存在高迁移成本、出口费用、生态系统锁定等问题

3. 训练数据

公共数据(如维基百科)、专有数据、合成数据

公共数据逐渐枯竭,大型科技公司凭借自有平台数据(如Meta、Google、Microsoft)形成数据优势

4. 基础模型

GPT、Claude、Llama等

市场活跃但集中,GPT-4占据2023年69%市场份额,存在高固定成本、规模经济、赢家通吃趋势

5. AI应用

ChatGPT、Gemini、Copilot、FinGPT等

应用层竞争激烈,但头部产品(如ChatGPT)已形成用户锁定,存在平台化倾向

硬件层:Nvidia 垄断,竞争壁垒高

市场集中度:2023 年全球数据中心 GPU 营收中,Nvidia 占比超 90%,AMD 及其他厂商合计不足 10%;芯片制造依赖TSMC(全球 > 60% 半导体、>90% 先进半导体产能),进一步加剧集中。

垄断驱动因素:

技术壁垒:GPU 并行计算能力适配 AI 需求,Nvidia 先发优势显著(早期服务游戏市场,积累并行计算技术)。

生态锁定:GPU 捆绑专属软件平台 CUDA(行业标准,仅支持 Nvidia 芯片),开发者基于 CUDA 构建代码,切换成本极高。

战略布局:2019 年收购 Mellanox,优化 GPU 网络连接效率,强化性能优势。

竞争动态:AMD、Intel 及科技巨头(微软、Google、华为)自研芯片,但短期内难以撼动 Nvidia 地位。

云基础设施层:三巨头主导,区域垄断显著

市场集中度:2024 Q1 全球云营收中,AWS(31%)、Azure(24%)、Google Cloud(11%)合计占 66%;2023 年全球 IaaS 市场三巨头占比 74%,区域市场更集中(如印度 87%、澳大利亚 77%)。

垄断驱动因素:

高切换成本:不同云厂商接口 / 技术差异大,工程师需重新培训(外生成本);使用专有软件会进一步增加切换难度(内生成本)。

限制性条款:收取高额 “出口费”(数据转出至竞品平台的费用,远高于中小厂商),微软对跨云使用 Windows 应用收取高额许可罚款。

生态捆绑:以折扣提供垂直整合服务(如存储 + 计算 + 分析),锁定用户。

训练数据层:公共数据枯竭,科技巨头占优

数据来源变化:早期 AI 模型(如 GPT-3)依赖免费公共数据(互联网文本),但研究预测高质量语言数据 2026 年将耗尽(Villalobos et al 2022),当前转向专有数据、合成数据及收购数据。

科技巨头优势:

专有数据池:Meta(Instagram/Facebook 数据)、Google(搜索 / 邮件数据)、微软(LinkedIn/Bing 数据)拥有海量用户行为数据。

数据获取策略:调整隐私政策(如 Google 允许用 Docs/Maps 数据训练 AI)、收购数据企业(2019 年 Google 收 Fitbit 获取健康数据)、合作数据平台(2022 年 Meta/Google 与 Shutterstock 合作)。

制衡因素:部分数据无有效反馈循环(无法提升模型性能),且数据增量存在边际效益递减。

基础模型层:动态竞争但头部集中

市场现状:全球超 300 个基础模型,由 14 家企业提供,但OpenAI、Google DeepMind、Anthropic、Meta 四家主导;2023 年 GPT-4 占生成式 AI 全球营收 69%(Korinek and Vipra 2024)。

集中驱动因素:

高成本门槛:训练 GPT-4 成本超 $1 亿 (The Economist 2023b),固定成本高、可变成本低,形成规模经济。

市场的网络效应(正反馈循环):先发者通过用户惯性、数据反馈循环巩固优势,即使成本下降,新进入者也难突破。

竞争模式:分 “专有”(OpenAI,高成本、低灵活)与 “开源”(Meta Llama,高灵活、易滥用),垂直整合趋势显著(模型厂商向上绑定硬件 / 云,向下延伸应用)。

AI 应用层:百花齐放但 “赢者通吃”

市场特征:ChatGPT 爆发后,AI 应用渗透医疗、教育、金融等领域,但数字平台 “赢者通吃” 逻辑适用。

典型案例:2024 年聊天机器人市场,ChatGPT 以 60% 月访问量占比领先,Claude、Gemini 等竞品合计不足 40%,先发优势(如 ChatGPT 的 “首个现象级 AI 应用” 认知)是核心壁垒。

三、大型科技公司(Big Tech)的扩张路径 美中科技巨头(如微软、Google、Meta、亚马逊、华为)是 AI 供应链的核心玩家,通过 “投资 - 整合 - 闭环” 策略扩大影响力:

大额投资与排他合作:2023 年科技巨头占 AI 企业总融资 33%,生成式 AI 融资占比达 67%(Graph 2.D);合作附加排他条款,如微软 $10 亿投资 OpenAI,要求其独家使用 Azure 云,亚马逊投资 Anthropic 绑定自身云与自研芯片。

垂直整合全链条:从硬件(自研 AI 芯片,如 Google TPU、亚马逊 Trainium)→云(AWS/Azure)→数据(专有池 + 收购)→基础模型(Google Gemini、Meta Llama)→应用(微软 Copilot、Google 搜索嵌入 Gemini),实现 “端到端控制”。

构建 “云 - 数据 - 模型” 闭环:控制计算资源与数据,使 AI 模型更优;模型使用生成更多数据,反哺模型迭代(“数据重力” 效应),进一步强化竞争优势

垂直整合:Big Tech(如微软、谷歌、亚马逊、Meta)已横跨所有五个层级,例如:

微软投资OpenAI并绑定Azure云服务;

谷歌、Meta、亚马逊自建芯片、模型和数据闭环;

亚马逊要求Anthropic使用其芯片和云服务。

数据闭环(Data-Cloud Loop):

云平台 → 数据生成 → 模型训练 → 更好服务 → 更多用户 → 更多数据 → 更强模型

资本控制:2023年,Big Tech占AI总融资的33%,在生成式AI领域占比高达67%。

四、市场集中带来的风险

风险维度

表现

消费者福利

选择减少、价格上升、锁定效应

创新方向

由少数公司主导,可能导致社会最优与私人利润不一致

运营韧性

单点故障风险高(如CrowdStrike事件)

网络安全

攻击面集中,系统性风险上升

金融稳定

金融机构使用相同模型/数据,可能引发羊群效应、顺周期性和市场闪崩

竞争与创新风险

消费者锁定:高切换成本导致用户难以转向中小厂商;

中小企业壁垒:GPU、云资源、数据获取成本高,新进入者难以生存;

创新方向扭曲:少数企业控制 AI 研发方向,可能偏离社会需求(如侧重盈利而非公共福利,Acemoglu 2021)。

运营韧性与网络安全

单点故障:依赖 Nvidia(GPU)、TSMC(芯片制造)、CrowdStrike(网络安全)等单一供应商,2024 年 CrowdStrike 软件故障导致 850 万台电脑崩溃,波及航空、银行等行业;

集中化攻击风险:核心基础设施集中于少数企业,一旦遭网络攻击,将引发跨行业连锁反应。

金融稳定隐患

模型同质化:金融机构使用相同 AI 模型 / 数据,加剧 “顺周期性”(市场繁荣时过度乐观,危机时过度恐慌);

市场波动:相似算法可能引发 “闪崩”“流动性枯竭”,如 2021 年美股算法交易导致的短期暴跌。

五、政策挑战与应对建议

政策难点:

多层市场、多个监管机构、目标冲突;

技术演进快于监管;

国际协调困难;

事后反垄断可能“为时已晚”。

政策建议(已在多国推进):

数据共享机制:建立公共训练数据集;

非歧视访问:确保小企业对基础模型的公平访问;

多云战略:降低对单一云服务商依赖;

标准化API:降低迁移成本;

国际监管合作:如G7、TTC、AI Action Summit等多边机制。

六、结论

AI供应链当前呈现出“上游高度集中、下游竞争激烈但易赢家通吃”的格局。Big Tech通过垂直整合、数据控制和资本优势,正在构建一个“大AI”生态系统。这种集中化虽带来效率,但也可能抑制创新、增加系统性风险。政策制定者需在全球协作框架下,动态监测市场结构、行为与风险,推动AI市场健康、包容和可持续发展。

问题 1:AI 硬件层(如 GPU)为何呈现 Nvidia 近乎垄断的格局?其他厂商(如 AMD、科技巨头)难以突破的核心障碍是什么?

Nvidia 垄断 GPU 市场的核心原因的是 “技术先发优势 + 生态锁定 + 战略布局” 的三重壁垒:

技术与先发优势:Nvidia 早期服务游戏市场,其 GPU 的并行计算能力天然适配 AI 模型训练 / 推理需求,比 CPU 效率高数千倍;2010 年后率先布局 AI 芯片,积累了超过 10 年的技术专利与用户认知。

生态锁定效应:GPU 捆绑专属软件平台CUDA(并行计算行业标准),开发者需基于 CUDA 编写代码,且下游应用(如 TensorFlow、PyTorch)深度适配 CUDA;切换至 AMD(依赖 ROCm)或科技巨头芯片需重构代码,成本极高,形成 “开发者 - 软件 - 硬件” 的闭环。

战略补强:2019 年收购 Mellanox,优化 GPU 间网络连接效率,使 Nvidia GPU 集群性能领先竞品 30% 以上(The Economist 2024)。

其他厂商难以突破的核心障碍是生态壁垒而非单纯技术:AMD、Intel 的芯片在硬件参数上可接近 Nvidia,但缺乏兼容主流 AI 框架的软件生态;Google、微软等科技巨头自研芯片(TPU、Athena)仅用于自身云服务,未开放生态,无法吸引第三方开发者,难以形成规模效应。

问题 2:科技巨头对 AI 供应链的垂直整合(如微软覆盖云 - 数据 - 模型 - 应用),对中小企业和行业创新会产生哪些具体影响?是否存在潜在益处?

答案:垂直整合对中小企业和创新的影响具有两面性,负面影响更显著:

(1)负面影响

中小企业生存空间压缩:

资源壁垒:科技巨头控制 GPU、云资源、高质量数据,中小企业难以获取廉价算力(如 Nvidia GPU 优先供应大企业)和训练数据(公共数据枯竭,专有数据被巨头垄断);

排他性限制:科技巨头通过投资绑定 AI 初创企业(如 OpenAI 绑定 Azure),禁止其使用竞品服务,中小企业失去合作机会。

创新方向受限:

短期创新:巨头倾向于投资 “能快速盈利” 的应用(如生成式 AI 聊天机器人),忽视医疗 AI、气候模拟等长期公共利益领域;

长期创新:新进入者难以突破巨头的生态闭环(如基于 Azure 的应用无法迁移至 AWS),抑制技术多样性。

(2)潜在益处

效率提升:垂直整合减少供应链环节摩擦,如 Google 的 TPU 芯片与 Google Cloud 深度适配,模型训练效率比 “第三方 GPU + 云” 组合高 20%(BIS 2024),可降低部分 AI 应用成本;

技术外溢:部分巨头开放基础模型(如 Meta Llama),中小企业可基于开源模型快速开发应用,降低研发门槛(如创业公司用 Llama 开发行业专属 AI 工具)。

总体而言,负面影响(抑制竞争、扭曲创新)远大于益处,需通过政策(如禁止排他性合作、要求开放生态)平衡。

问题 3:AI 供应链集中化为何会威胁金融稳定?监管机构可采取哪些针对性措施防范此类风险?

答案:AI 供应链集中化威胁金融稳定的核心逻辑是 “风险传导的集中化与同质化”,具体路径及应对措施如下:

(1)威胁金融稳定的具体路径

模型与数据同质化→顺周期性与羊群效应:金融机构依赖少数科技巨头的 AI 模型(如风控模型、交易算法)和数据(如用户信用数据),导致所有机构在市场繁荣时过度放贷、危机时集中抽贷,加剧金融周期波动(Aldasoro et al 2024);

核心供应商故障→系统性中断:金融机构依赖 Nvidia(算力)、AWS(云)、特定基础模型厂商,若供应商遭 网络攻击或运营故障(如 2024 年 CrowdStrike 事件),将导致银行交易系统、券商算法交易、保险公司风控瘫痪;

算法趋同→市场波动与流动性枯竭:相似 AI 交易算法在极端行情下会同时触发 “止损”“平仓” 指令,引发闪崩(如 2021 年美股 “ meme 股” 波动),甚至导致市场流动性突然消失(OECD 2021)。

(2)监管机构的针对性措施

强化供应链韧性监管:要求金融机构披露 AI 供应链依赖关系(如 GPU 供应商、云服务商),制定 “关键供应商中断应急预案”,强制备份方案(如同时使用 2 家以上云厂商);

防范模型同质化:鼓励金融机构开发定制化 AI 模型,限制 “一刀切” 采用第三方通用模型;要求模型厂商披露数据来源与算法逻辑,避免机构盲目跟风;

建立跨机构风险监测:搭建 AI 金融风险共享平台,实时监控不同机构的 AI 模型使用情况,预警 “算法趋同” 风险;对高频交易 AI 实施 “波动阈值管控”,防止极端行情下的过度交易。

国际协同:推动全球统一的 AI 金融风险监管标准(如 BCBS 2024 数字金融监管框架),避免监管套利(如金融机构将高风险 AI 业务转移至监管宽松地区)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Dance with GenAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、研究背景与目的
  • 二、AI供应链的五个层级
  • 四、市场集中带来的风险
  • 五、政策挑战与应对建议
  • 政策难点:
  • 政策建议(已在多国推进):
  • 六、结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档