问题意识
- • 数据密集性场景对作为缓存层的内存介质提出越来越多的挑战,内存新介质当前处于怎样的发展阶段?
- • Chiplet 如何通过封装创新来扩展新内存介质应用场景?
新型存储器市场概述
- • 在之前的演讲(FMS)中,我们展示了为何新兴存储器从未真正崭露头角。
- • 它们需要成为小众、嵌入式,或者无额外成本地添加到 DRAM/NAND。
- • 并不存在,也永远不会存在一种“通用存储器”。
- • 《Nature》和《Science》将会有文章推广通用存储器。
- • Optane 表明,即使投入数十亿美元并支持生态系统,由于大众接受度过于缓慢,无法围绕其建立晶圆厂。
- • 因此,大多数新型存储器最终成为小众产品或被放弃。
Note:商品化的存储市场,一旦形成产业态势,新型存储器的市场空间,将明显受限。
新型存储器细化评分
不同存储技术从延迟、密度、成本和大规模制造准备度四个方面进行了评估,使用颜色和星级标记优劣:
- • DRAM 和 NAND 在大多数指标上表现优秀,特别是在制造准备度上。
- • SRAM 延迟低但密度和成本差。
- • MRAM、RRAM 和 PCM 性能均衡,但仍存在改进空间。
- • 较新技术如 FE RAM 和其他类别,整体评分偏低,特别是在大规模制造方面。
存储介质成本随时间变化
- • SRAM 技术发展,短期来看很难降低成本,尤其是最新SRAM技术,成本不减反增;
- • DRAM 成本短期很难下降;
- • NAND 随着QLC技术不断成熟和规模化商用,替代TLC/MLC, 成本仍有下降空间;
- • 新型存储介质如 MRAM、ReRAM等短期成本大幅下降可能性不大。
存储介质优缺点对比
SRAM 扩展面临问题
SRAM 是最快的存储器,并且可以快速集成到逻辑处理器中。
多年来,单元尺寸从 40F 缩小到 200F。(F代表制造工艺的最小线宽 Feature Size,随光刻工艺不断进步,单位面积上可集成的数量不断增加。)
很多聪明的人曾认为它无法缩小到 16nm 以下:
- • 在接下来的 8 年里,它的缩放因子达到了 4。
- • 但似乎在 3-5nm 时停滞了(TSMC N5 是 0.02μ²)。
因此,L2-L4 缓存需要新的解决方案。
Chiplet 解决方案
- • 挑战:
- • 芯片面积和功耗急剧增加,特别是在 SRAM 缓存和高速接口方面。
- • 随着技术的进步,单一的大芯片越来越难以制造,导致良品率降低,生产成本增加。
- • Chiplet 解决方案:
- • Chiplet 是将一个大型集成电路设计分解为多个小模块(芯片),每个模块执行特定的功能。这些小模块可以通过高带宽的互连技术组合在一起。
- • 这种方法允许在不增加单一芯片尺寸的情况下,组合不同的功能模块,并且易于在不同的工艺节点中选择最适合的技术。
- • 好处:通过更灵活的设计降低了生产成本,提升了良品率,并能提供更高的模块化和可扩展性。
图示为Chiplet 架构
成本与策略
- • 小部分芯片的特定功能需求:
- • 例如:NOR 用于启动和 XIP 代码,SRAM 用于缓存,MRAM 用于快速非易失性存储(NVM)。
- • 以前的情况:
- • 需要选择特定的工艺或通过 PCI、DDR、CXL 等接口访问存储。
- • 现在的改进:
- • 芯片设计人员现在可以选择任何存储特性,而无需依赖嵌入式工艺。
- • 存储供应商可以在不使用尖端硅工艺或大批量生产的情况下提供存储。
- • 之前成本不可行,现在可以实现,例如 40nm NOR、22nm MRAM。
- • 基于 Chiplet 的芯片设计:
- • 允许所有选项,优化成本并支持未来版本的修改。
- • 例如:可以从 NOR 开始,未来迁移到 MRAM,或者添加 AI 优化的存储(如权重存储)。
Note:Chiplet 虽能实现资源的按需组合,但亟需解决组件间的互联时延和带宽瓶颈,或许多少年后的UAlink能解决这一问题。
对于较小的晶圆面积和较低成本的工艺(如 22nm),嵌入式 MRAM 和 Chiplet MRAM 的成本相差不大。
当晶圆面积增大,尤其是采用高端工艺(如 N5),Chiplet MRAM 的成本优势显现,嵌入式 MRAM 成本快速上升。Chiplet 技术更适合大面积、高复杂度设计。
Note:严格来讲 Chiplet应属于封装领域前沿技术,是用来应对高端工艺瓶颈期面临的挑战。
总结
允许芯片设计者实现多种存储器的组合,包括根据权衡需要的小众存储器。
可混合多种存储器,并具有随时间进行修改的选项。
可以在不影响逻辑的情况下单独优化成本。
通过优化 SRAM,可以节省 10% 的成本。
在先进工艺中,使用 Chiplet 的成本权衡对大型逻辑芯片是有利的。
小型芯片则因封装成本受限而受到影响。
与传统的嵌入式存储或离散存储相比,这种方法为芯片设计者提供了更多的存储选择。