
2026 年 4 月 27 日,Y Combinator 发布 Summer 2026 Request for Startups(RFS)。顶级加速器对未来一年投资方向的核心判断 —— 基础设施 infrastructure 这个词出现了十几次。
YC 将本次 RFS 归纳为五大主题:
AI 已经不再是一个功能了,它是地基。

YC 列出了 15 个与 AI 基础设施直接相关的创业方向。我们挑几个最值得关注的:
当前 GPU 设计针对"提示入、响应出"的工作方式。但 Agent 工作方式是循环的:调用工具、分支、回溯、跨数十个步骤保持上下文。
这是一种完全不同的硬件问题。
GPU 在 Agent 工作上仅达到峰值的 30-40% 利用率,因为工作是 突发型的。像阵雨,突然倾盆而下,然后长时间大晴天。系统需要快速响应峰值,但大部分时间资源闲置。
NVIDIA 已经动手了,以 200 亿美元收购 Groq。Google 为推理专门构建了 TPU v7。但还没有人正在为 agent 循环本身设计:
模型间快速上下文切换、原生推测解码、为 KV 缓存构建的内存。
ps:原生推测解码,指的是用小模型“草稿”一次性生成多个候选 token,再由大模型并行验证,从而减少自回归步数。原生指该机制已深度集成到推理引擎/编译器/硬件底层。
KV缓存,是大语言模型在生逐 token 输出过程中,用于缓存每一层神经网络已计算过的 Key(键)和 Value(值)向量的内存结构。核心目的:避免重复计算,让生成速度提升 10~100 倍
这里有个细节:NVIDIA 收购 Groq 不是财务投资,是战略卡位。

YC 合伙人 Tom Blomfield 说:

需求是:将知识从所有分散的来源中提取出来,结构化,保持最新,并转化为 AI 可执行的技能文件。不是公司级搜索,不是文档上的聊天机器人。是公司实际如何运作的活的地图。知识库架构师#让AI理解企业知识
这个方向目前还是空白领域

一颗先进 AI 芯片经历约 1,400 个工艺步骤,跨越十几个国家,需要五个月才能制造。这个供应链目前用电子表格、SAP 和电话管理。
2021 年,一颗 300 美元的芯片让一辆 50,000 美元的汽车停产。台积电的先进封装是 AI 计算目前最大的瓶颈,NVIDIA 已锁定其 60% 以上。高带宽内存在 2026 年前已预订满额。出口管制每季度变化。
机会:用 AI 重建这条供应链的可见性和协调能力。
相比 2025 年的 3810 亿美元,同比增长约 67%。这些钱流向哪里?推理芯片、无服务器 GPU 网络、光子学通信、封装产能 —— 全是基础设施层。
Google AI 基础设施首席技术官 Amin Vahdat 在 Transition-AI 2026 上的判断:

ps: GW 是吉瓦功率单位,1 GW = 10 亿瓦特 = 1,000 MW = 1,000,000 kW 直观对比: 1 户家庭用电:1–3 kW 1 个大型数据中心:10–100 MW 1 GW ≈ 10 个超大规模数据中心或 1 座中型核电站的输出功率
瓶颈顺序在演变:GPU → 内存 → 网络 → CPU 架构。
每一次瓶颈转移,都意味着新一代基础设施投资机会。
YC 不是预测,是行动纲领。它在告诉创业者:红海、蓝海分布在哪些方向。
当 YC 明确提出"Agent 技术栈作为基础设施",意味着:
这不是"AI 可以做什么"的问题,而是"AI 依赖什么才能运作"的问题。