全文概览
随着AI和大数据应用的爆发式增长,云存储系统面临性能与成本的双重挑战。传统QLC SSD虽具备高密度优势,却受限于写入放大效应(WAF)和耐用性问题。在此背景下,云存储加速层(CSAL) 应运而生——这一由Solidigm主导的开源技术,通过创新架构设计将超高速缓存(如Optane)、写入塑形层与QLC介质深度融合。
CSAL的独特价值在于:
阅读收获
图片介绍了云存储加速层(CSAL)的概念及其工作原理。
CSAL 是一个开源的云规模无共享闪存转换层,旨在提升性能、扩展QLC的价值,并为上层应用提供透明的块设备。它通过超高速缓存和写入塑形层来改善性能和耐用性,同时提供在多租户环境中的一致性能。图片还提到了Solidigm的几个SSD产品,如D7-P5810和D5-P5336。
其中 D7-P5810 作为CSAL 缓存层能提供更高性能的读写能力,而 D5-P5336 因其高密度、大容量成为持久化存储的选择。
Note
在Azure:从“OceanStor”到AI未来:对象存储如何助力AI应用的演进一文中,微软对象存储高级专家认为,低成本、可扩展的对象存储技术将成为支撑AI/HPC应用的重要基础,而提高对象存储访问带宽和时延是急需优化的问题,否则将限制上层应用的演进。从这里来看:CSAL 将成为QLC 大容量SSD在AI场景落地应用的重要架构设计!
此外,在2024年的FMS会议上,CSAL又有新的进展,包括:
图片讨论了数据放置在 CSAL 中的重要性。没有对异质流进行排序会导致写入放大因子(WAF)增加,而通过将数据分别放置,可以减少数据的移动并降低 WAF。CSAL 已通过在 ZNS 驱动器上验证了这种方法的有效性,并且当使用灵活数据放置(FDP)驱动器时,也可以实现相同的效果。图表和表格展示了使用标准 SSD 和 ZNS SSD 之间在 WAF 上的差异,并详细列出了不同写入模式下的配置。
Cite
更多关于 FDP 技术原理和场景应用的文章,可参考:
图片展示了在 CSAL 中如何实现灵活数据放置(FDP)。尽管 CSAL 使用带来组织存储数据,但每个带在打开时都需要分配一个放置句柄。在数据写入时,CSAL 可以通过轮询方式利用回收组来进行写入分级,从而优化存储过程。图中的回收单元和回收组显示了如何管理这些数据区域,确保系统高效运行。
展示了 CSAL + FDP 的评估设置。主要包括使用 QEMU 模拟一个 FDP 驱动的环境,前提条件是首先填充所有分区并执行顺序写入。接着,展示了一个异质流工作负载的示例,包含 8 个作业,其中 4 个是 64k 顺序写入,代表动态流,另 4 个是 64k 随机读取,代表静态流。该设置帮助模拟和评估不同流的行为和性能。
图比较了 CSAL 在常规驱动器和 FDP 驱动器上的写入放大因子(WAF)。在常规驱动器上,分离动态流和静态流的尝试失败,导致 WAF 达到 1.8。而在使用 FDP 驱动器时,动态流和静态流的分离成功,WAF 被显著降低至 1.0。图片清楚地展示了通过适当的流分离,CSAL 可以显著提高性能并减少写入放大效应。
图片介绍了关于 PCIe Gen5 缓存 SSD 性能的评估。
评估的关键假设是:Gen5 SSD 是否能够支持两个闪存转换层(FTL),而不会影响性能,相比于 Gen4。在测试中,使用了 Solidigm 和 Intel Optane 的 SSD,工作负载包括 16 个作业,进行均匀的随机写入测试。测试在一台搭载 Intel Xeon Gold 6426Y 处理器的服务器上进行,操作系统为 Fedora 39。
多个 闪存转换层(FTL)的应用价值
支持多个 FTL(闪存转换层)的主要原因是提高存储设备的灵活性、性能和利用率。具体的价值包括:
图展示了使用 Gen5 驱动器时,扩展 FTL(闪存转换层)数量对性能的影响。通过对比 Gen4 和 Gen5,Gen5 驱动器支持更多的分区(16 个,而 Gen4 只有 8 个),尽管在带宽上略有下降(Gen4 为 100 MiB/s,Gen5 为 90 MiB/s),但 Gen5 提升了平台的利用率并保持了相似的性能。
Note
Gen4:写带宽性能更好,大概率可归因于试用Optane 作为缓存层,比Gen5 对照组的 TLC 性能更好。
图对比了 Gen4 和 Gen5 缓存驱动器的影响。尽管 Gen4 提供更好的性能和更少的故障风险,但其成本较高且需要更多的 PCIe 插槽。相比之下,Gen5 在性能上稍微降低,但其成本较低并且减少了对 PCIe 插槽的需求。不过,使用 Gen5 可能会导致缓存的写入放大(WAF)增加,因此可以通过采用 RAID1 或使用灵活数据放置(FDP)等方式来减轻这些问题。
Gen5 和 Gen4 缓存驱动器影响
项目 | Gen4 | Gen5 |
---|---|---|
PCIe 插槽 | 4 | 3 |
作业性能 [MiB/s] | 100 | 90 |
相对 SSD 成本² | 100% | ~75% |
活动功率 | 2x21W(Optane)+ 2x24W(D5-P5336) | 1x25W(D7-PS1010)+ 2x24W(D5-P5336) |
空闲功率 | 4x5W | 3x5W |
Note
原材料中给出了成本测算的条目,可在文末跳转查看材料。
结论:
下一步:
延伸思考
本文到这就结束了,或许思考下面几个问题,能有更多收获!
原文标题: Cloud Storage Acceleration Layer FDP NVMe Technology Implementation and Scaling with PCIe Gen5 Cache SSD