文章略长,对于想了解UCIe 的朋友来说,可能不是直击痒处,通过具体的案例和落地方向来介绍SoC 多Die应用场景。
文档由 Nilesh Shah (ZeroPoint Technologies) 发表,探讨了未来内存和存储技术的发展方向,特别是基于Chiplets的压缩LLC缓存与内存扩展技术。
图表展示了随着制程节点的缩小(从14/16nm到5nm),三家芯片制造公司的SRAM单元尺寸的缩放趋势。主要观察点包括:
Quote
SRAM(Static Random Access Memory,静态随机存取存储器)由于其高速和低延迟的特点,广泛应用于需要快速存取的场景,包括以下几个方面
随着制程技术的不断进步,SRAM 的容量和集成度大幅提升,但其容量仍然远低于 DRAM 和 NAND 闪存,主要因为其结构复杂、成本高。以下是先进 SRAM 的容量等级
Note
之所以更强调延迟而不是容量,是为后面要介绍SRAM内压缩技术做铺垫,小体积文件传输对带宽和时延都有帮助。
2-4倍压缩(2-4X Compression)
Quote
节约空间、降低时延的同时,会带来什么副作用?
Quote
LLC(Last-Level Cache)是计算机处理器架构中的最后一级缓存,通常是 L2缓存 或 L3缓存(甚至更高,如L4)。它是靠近内存(DRAM)的一层缓存,旨在为多个核心共享存储数据,减少访问主存的延迟和频率。
Quote
LZ4是一种无损压缩算法,因其高速度和低延迟的特性而被广泛应用于各种存储与数据传输场景。它的设计目标是尽可能快地处理数据,而不会显著增加计算负担或延迟。
LZ4基于LZ77压缩家族,是一种流行的无损数据压缩算法,以其简单、高效的实现和性能而闻名。LZ4的特点是:
LZ4采用了类似LZ77的滑动窗口机制,具体步骤如下:
LZ4牺牲了一些压缩比,换来了更快的匹配和编码速度。
在讨论LZ4压缩时,粒度指的是压缩操作的数据块大小。例如:
在**缓存压缩(Cache Compression)**场景中,64字节粒度更适合,因为缓存行通常是以64字节为基本单位,而大粒度(如4KB)可能导致延迟增加或存储碎片。
LZ4的核心特点在于高速度,而不是追求极致的压缩比:
对于需要极高压缩比的场景(如归档文件),可能不适用。但对于缓存、网络传输等对速度要求高的应用,是理想选择。
在缓存压缩中(如L2缓存、L3缓存或内存压缩),LZ4具有以下优势:
LZ4是一种轻量级、高性能的压缩算法,特别适合于对速度要求高的场景。在缓存压缩中,64B粒度和4KB粒度各有优势,具体选择取决于应用场景的需求 小粒度适合随机性强的缓存,而大粒度则在连续数据处理中表现更优。
Note
之所以这篇文章被放到FMS24-UCIe的大类里,大概率就是此处引入的IP,需要基于SoC互联技术以实现多Die封装。
Quote
NuMem NuRAM 发展现况
MRAM(磁阻随机存取存储器)作为新一代非易失性存储技术,近年来取得了显著进展。以下是MRAM及其代表性实现NuMem NuRAM的最新发展现状
MRAM技术正处于快速发展阶段,预计未来十年将持续增长。第一代产品将在工业领域和航空航天中继续应用;第二代产品将在物联网终端、车载系统和数据中心中得到广泛采用;第三代技术的发展将为我国实现自主创新提供重要机遇。IC Views[7]
总体而言,MRAM及其实现形式NuMem NuRAM在存储器领域展现出巨大的潜力,随着技术的不断进步和应用的拓展,未来有望在更多领域中发挥关键作用。
图示展示了一个SoC芯片系统基于多芯粒设计的架构,其中包含以下主要模块
随着SoC 设计向Chiplets 转型,每个Die负责专用功能,都会集成一定的数据缓存容量,在实际业务中如何保证不同Die之间的数据一致性,是 Chiplets 落地的关键。
ARM CMN-Cyprus的作用
Call to Action - Community Collaboration (行动号召 - 社区协作)