7月29日,由杭州市萧山区人民政府、浙江省半导体行业协会主办,萧山经济技术开发区管理委员会、杭州国家“芯火”双创平台(基地)协办的“2021全球闪存峰会”在杭州国际博览中心开幕。在29日至30日,来自Intel、浪潮存储、新华三等国内外存储企业领军人物都将汇聚于此,交流思想理论、分享实践案例。
作为NAND闪存领域的领导者,Intel在这次峰会上传递出什么样的信息,无疑是大家非常关心的焦点。本文就英特尔NAND产品与解决方案事业部中国区销售总监倪锦峰在存储技术与应用等分论坛上的演讲内容做个简介和分析。
1. 持续推动NAND创新
2020年10月份,Intel决定将NAND闪存业务出售给SK海力士,并计划将交易所获资金投入具备长期成长潜力的重点业务。而对于NAND闪存业务,待第一阶段交易结束时,将会成立新公司并保持全球独立运营,其在保留领先技术、平台互联优势的情况下,同时获得更灵活的产能支持,并可以更加聚焦在SSD产品级研发上。NAND技术如今已经非常成熟,从最早的SLC一直到当前的QLC,NAND在性能上拥有超高的覆盖度,位于DRAM之下,机械硬盘之上,几乎全覆盖。英特尔及将来的新公司持续致力于NAND技术的不断创新,得益于Floating Gate的3D NAND技术,QLC SSD产品已经非常成熟,后续的PLC,HLC等,其发展已经是轻车熟路。
卖掉NAND业务之后,Intel会保留Optane业务,并更加聚焦于新存储介质Optane的研发和推广普及,以及基于Optane的持久内存和固态盘的产品级研发,是行业里SCM (存储级内存)技术的领头羊。
一款SSD的可靠性、性能以及成本,很大一部分取决于后端NAND颗粒,另一部分取决于主控和固件的架构优化程度。得益于Intel NAND的多项先进技术,Intel SSD目前是市场上可靠性最佳的产品,在各大互联网数据中心里部署占比也是最高的。
Intel在2020和2021年连续发布了多款SSD产品,比如2020年底,就批量发布了6款产品:
· SSD D7-P5510-数据中心级NVMe,144L TLC
· SSD D5-P5316-数据中心级NVMe,144L QLC
· SSD 670p 客户端消费级NVMe,144L QLC
· Optane SSD P5800X 数据中心级NVMe,第二代3DXPoint
· Optane持久内存H20 客户端消费级NVMe,144LQLC + 3D XPoint
· Optane持久内存300系列:代号Crow Pass,3DXPoint DIMM
而在2021年,企业级SSD方面,针对云存储加速的144层TLC的D7-5510在2021年上半年批量出货;针对温存储优化的搭载144层QLC的D5-5316在2021年Q2批量发售;2021年7月7日,发布了用于传统服务器应用的SATA接口的搭载144层TLC的D3-S4520和D3-S4620。
在消费级产品方面,发布了基于QLC 3D NAND的660p和670p两款产品。其中SSD 670p针对低队列深度的请求进行了调整和调优,并且还针对混合读/写工作负载进行了调优。SSD 670p可以提供高达3.5 / 2.7 GBps的顺序读/写吞吐量,并在队列深度为1的情况下最高到20,000 /54,000随机读/写IOPS,这个指标对于桌面类应用的操作性能非常有益。在256队列深度处,最高性能达到了310,000 /340,000随机读/写IOPS。
2. 业界卓越的Intel NAND技术
英特尔拥有广泛的闪存单元经验,独特的浮动栅极技术可以实现业内领先的面密度,更小的单元尺寸,预计比替代性技术小大约 15%。以及拥有把控制逻辑电路放到内存阵列下的独特方法:阵列下 CMOS(CUA)。这两项技术结合起来,使得面密度比替代性产品高10%。这是因为阵列下 CMOS不会浪费空间,从而可以在几乎每平方毫米晶圆上制造更多存储单元。
英特尔拥有领先的Floating Gate(浮栅)技术,其 3D NAND 采用经过充分验证的技术来解决单元可靠性挑战。浮栅技术通过隧道氧化层控制电子流动。30多年来,Intel在架构、材料、工艺等方面不断创新优化,不断提升单元可靠性。浮栅技术能够做到单元隔离,也就是电荷存储节点是隔离的。这种独特方法可以非常好地防护电荷丢失和单元间干扰。独特的垂直全环绕栅极结构可以让每个单元提供的电子数接近平面浮动栅极的6倍。更多电子意味着更高的控制力,更小的容差。更多电子容量还意味着可以让存储单元受到少量电子泄漏造成的电压变化的影响更低。
RWB (Read Window Budget,阈值电压窗口) 指标对于NAND可靠性至关重要。RWB越大越好,出错概率越小。下图展示了1b/c一直到 4b/c 之间的差别,你会注意到位之间的差距越小,每个单元的位数越多。然而,如果看看右侧的图表——其中对比了浮动栅极单元和电荷捕获单元两种技术的RWB——可以看到浮栅单元的RWB高于电荷捕获技术。RWB越高,数据保留周期就越长,可靠性越好,从而也更容易实现4b/c, 5b/c等技术的产品化。Intel 浮栅技术的RWB非常卓越,这大大提升了QLC的数据维持能力,很好地加速QLC的商用化落地,并给后续的PLC等带来了曙光。
综上,英特尔是 3D NAND 技术的领导者,拥有超过 30 年经过验证的可靠性和质量。
3. QLC NAND靠不靠谱,看Intel怎么说
QLC技术产品化落地已经有2年多了,针对QLC技术的生态系统也在不断完善,但市场上对QLC技术依然有些“担忧”或者误解。
关于性能:QLC拥有良好的顺序读写以及随机读性能,非常适合读密集等应用。针对QLC的性能担忧,实际上,QLC在性能密度上虽然下降了,但是对于基于QLC的SSD产品,可以通过多种技术对性能进行补偿,比如多通道,多Die,利用高并发对性能进行补偿。比如在实际测试中,基于QLC的PCIe 4.0 NVMe SSD完全可以饱和x4 PCIe 4.0通道的8GB/s理论带宽。
关于寿命:QLC在介质寿命上的确相比于TLC有所降低,然而实际上,针对读密集型应用或者大文件顺序写等应用,QLC的寿命绰绰有余。此外,根据国外一项统计(https://www.usenix.org/conference/fast20/presentation/maneas),2020年在线的SSD实际寿命损耗只有不到1 DWPD。99%的固态盘在退役之前,仅仅使用了15%的寿命。
在现实的SSD的故障模型中,NAND磨损导致寿命终结的概率非常低。多数场景都由于其它方面故障,比如元数据不一致无法修复问题,固件问题,以及其它软硬件故障。
Intel的QLC技术具备高性能、大容量、高质量和高可靠性等优势。创新的浮动栅极架构拥有紧密、对称的层结构,结合CuA(CMOS under Array, 阵列下CMOS技术),没有Cell开销。此外,这种动态架构改变了Cell配置,以满足用户对存储容量和性能的需求。该技术使高性价比的大容量存储成为现实,并有助于加快固态盘的普及。
另外,Intel不断加速技术和架构创新,比如独立多平面读取操作(IMPRO)技术,通过将四个平面分成两个可以异步读取的双平面组,从而使读IOPS增加了一倍。IMPRO的异步特性会产生噪声耦合,为了减轻这种影响,英特尔配置了电荷泵,字线/位线调节器和压降(LDO)调节器,以驱动每个平面组中的单独负载。 此外,为了解决QLC技术的敏感性并减少首次写入的损失,该闪存具有4-16多轮编程算法和1-2-6-6格雷码设计。通过四级动态启动技术对Cell进行优化,该技术首先将Cell编程为4级状态,然后从单元中读取数据,再将单元编程为最终的16级状态。
基于QLC NAND的典型产品是Intel SSD D5-P5316:其采用PCIe 4.0 接口,满足JEDEC 规格,以及与 TLC NAND 固态盘相同的 MTBF 、AFR、保修、UBER、数据保持等特性规格。D5-P5316 固态盘非常适合读取密集型、大数据块、高 QoS 工作负载。例如 CDN、超融合基础设施、大数据、人工智能、高性能计算和云弹性存储。这些细分市场同时采用了全闪存阵列和混合阵列,而P5316 有机会取代全闪存阵列中的 TLC 存储以及混合阵列中的硬盘,实现存储整合和数据加速。