首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Bill Gervasi:CXL在移动设备上的应用

Bill Gervasi:CXL在移动设备上的应用

作者头像
数据存储前沿技术
发布2025-02-11 18:49:35
发布2025-02-11 18:49:35
1.2K0
举报

问题意识

1. CXL在数据中心的应用价值已被证明,AI、分析型数据库等高性能场景对内存容量和带宽的需求,成为CXL在数据中心落地的助推力

2. 移动设备同样也有扩展内存的需求,基于CXL在服务器上的扩展形态,将带来高能耗、过度冗余等系统问题,如何优化CXL在移动设备上的使用?

3. 文字提出基于PCIe接口实现 NAND+DARM 新内存/存储形态

  • • 好消息是,CXL® 最终结束了“互连结构之战”。
  • • 最终,各公司可以投资于标准解决方案,并期待一个庞大市场。
  • • 和往常一样,大型主机将是早期采用者。
  • • NVLink/UALink 是 CXL 的补充。
  • • 不过,CXL Type 2 可能会被淘汰……

CXL Type 2 是什么,为什么说会被淘汰?

Type 2:用于更复杂的加速器,尤其是带有自己的处理能力和存储的设备,如具有独立计算和内存的 GPU、FPGA 等。Type 2 设备可以访问主机内存,也可以使用自己的内存。 淘汰的原因:其他互连技术(如 NVLink 和 UALink)可能提供了类似或更高效的功能,使得 Type 2 的作用被弱化。尤其是在 NVLink 等技术作为补充的情况下,使用CXL互联Type 2 的需求可能会下降。

关于CXL 设备的Type解读,参考阅读:

CXL 在数据中心构建统一的 Switch 网络,提供的计算、内存、存储和通信系统。

为什么CXL集成到主板会成为重点议题

来关注下移动智能设备市场,图表展示了2024至2028年各类计算设备的全球市场出货量预测,预计总出货量将维持在400多百万单位。相比之下,数据中心的设备市场规模相对较小。红色注解表明,CXL芯片制造商需要足够的市场规模来分摊晶圆厂的成本,整体市场的巨大规模为CXL技术的应用提供了基础。

  • • Detachable Tablet:可拆卸的平板电脑,指屏幕和键盘可分离。
  • • Slate tablet:平板电脑,它通常没有物理键盘和触控笔输入设备,而是完全依赖于触摸屏进行交互。

存在的问题是:分离式CXL内存扩展,能耗是个大问题,没办法在移动设备中采用。

将 CXL 移到主板是下一步合乎逻辑的发展

CXL 在移动设备上的优化路径:

  • • 降低功耗
  • • 缩小占用空间
  • • 缩短通道

PCI-SIG 是一个由硬件制造商组成的组织,致力于开发和推广 PCI 标准。最近,他们提出了一种名为 FleX 的灵活 CXL 模块,旨在为主板提供更高效的内存访问。

该模块的设计非常灵活,可以根据不同的应用场景进行定制化配置。例如,在需要大量内存的情况下,可以通过添加更多的 CXL 扩展卡来增加内存容量;而在需要更高的带宽时,则可以选择更高性能的 CXL 设备。

FleX 模块的优点在于它能够提高主板的灵活性和可扩展性,同时也可以降低系统的功耗和成本。这对于需要高性能计算能力的企业和个人用户来说都是非常有吸引力的选择。

FleX 是一种为主板设计的灵活 CXL 模块,宽 25.15 毫米,支持 PCIe Gen6 x8 和 CXL 技术,适用于台式机、工作站和移动设备。它提供模块内的电压调节,功耗约 11W,可放置于两个 PCI 插槽之间,最大通道长度为 150 毫米。目前计划的长度有 30 毫米、60 毫米和 80 毫米,具有标准化的引脚配置。

Note:当前笔记本电脑DDR4 16GB 功耗大概在3-5W。

当前系统将内存和存储严格区分,但 CXL 技术为模糊这一界限提供了可能性。尽管 DDR 协议主要用于内存,但基于 PCIe 的 M.2 接口可以成为重新定义内存和存储扩展的新起点。这表明未来的硬件架构可能会通过 CXL 融合内存和存储资源,提高系统灵活性。

通过在主板上集成CXL接口,可以将存储和内存集成到一起(如图中红圈所示)。

CXL 集成到主板的客观原因

  • • DDR5 降至每通道一个模块意味着系统容量减少一半——基于 CXL 的内存扩展可以替代损失的 DDR
  • • AI 算法和芯片每天都在变化,需求的内存比以往更多——基于 CXL 的 AI 内存可以升级
  • • 固定的设计阻碍了行业创新
  • • 主板上的 CXL 就像 1992 年的 PCI……为下一代 PC 的新想法打开了大门

为什么 DDR 降至每通道一个模块?

DDR5 每个通道只支持一个内存模块的设计是为了提高数据传输效率和降低信号干扰。而 DDR4 在大多数主板上是支持每通道两个内存模块的。以下是这种设计差异的主要原因:

  1. 1. 通道设计差异 DDR5 采用了双 32 位子通道设计(每个模块有两个独立的 32 位子通道),而 DDR4 是一个 64 位的单通道。DDR5 的这种设计可以提高数据传输效率,使得内存控制器可以在更高频率下处理数据。因此,DDR5 内存模块不再需要依赖两个模块来实现高带宽,而是通过两个独立子通道达到类似效果。
  2. 2. 信号完整性与稳定性 DDR5 的数据传输速率比 DDR4 更高,支持更高的频率(如 4800MHz 及以上)。更高的频率带来了更大的信号干扰问题。如果每个通道支持两个内存模块,这种高频干扰会更严重,可能导致信号质量下降。因此,为了保证信号的完整性和系统的稳定性,DDR5 选择在每通道只支持一个内存模块。
  3. 3. 简化内存拓扑 在 DDR5 的设计中,通过限制每通道的内存模块数量,可以简化内存控制器和主板的设计,同时减少信号传输路径的复杂性。这有助于降低生产成本,也让内存控制器能够在更高的频率下运行。

创新方向:NAND和DRAM封装在同一个主板上,节约主板空间的同时,有效提升移动设备的内存,从而支持新场景的大内存应用。

总结

  1. 1. CXL 在未来硬件系统上的互联价值已被行业普遍接受,NVlink/UALink 将与其形成互补,构建新兴硬件互联架构;
  2. 2. 推动CXL在移动端设备的落地是降低CXL应用成本,同时加速生态落地的关键;
  3. 3. 将CXL设备集成到主板,通过M.2接口,实现NAND + DRAM 二合一的设计是未来CXL在消费端落地可能性之一。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 问题意识
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档