Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >STARBLAZE(忆芯):SSD中分布式软件架构

STARBLAZE(忆芯):SSD中分布式软件架构

作者头像
数据存储前沿技术
发布于 2025-02-11 10:42:06
发布于 2025-02-11 10:42:06
2120
举报

按:之前学习材料整理过大量海外厂商方案,随着不断推进,不少国内优秀方案也逐渐映入眼帘。抱着学习的心态尝试理解要义,如有误,欢迎指出,多交流,才能进步!

问题意识

1. 长期以来,文件系统作为OS调用文件的元数据管理层,与OS内核紧密交互,用户态文件系统也不是新鲜事,这些方法都需要将数据读取到Host上分析,数据迁移量不容小觑,数据管理任务能进一步下沉吗?

2. 将FS部署到先进SSD上组成分布式的SSD文件系统,优化数据读取过程。

关于 STARBLAZE[1] (忆芯科技)

北京忆芯科技有限公司(Starblaze)成立于2015年底,是一家专注于芯片及解决方案的高科技企业。公司致力于成为世界级的大数据芯片及方案公司,业务覆盖消费级和企业级市场,主控芯片和解决方案是其核心业务方向。忆芯科技总部位于北京,并在上海、成都、厦门和深圳设有研发中心和客户技术支持中心。

SSD 概览

随着PCIe速度的提高,SSD控制器的能力变得越来越强大:

特点列表:

  • • 强大的CPU
  • • 高速DMA
  • • 大容量DDR
  • • 硬件加速器(例如加密、缓冲管理等)

左下角显示 PCIe接口带宽升级路线。

右下角显示主控 STAR2000 结构拓扑。

前端为:PCIe Gen4 接口,可选4通道或2通道x2

中间为主控上各种模块组件:

  • • NVMe 2.0 控制器
  • • ARM Cortex-A55 CPU
  • • NPU(神经处理单元)
  • • 硬件加密模块(支持AES/RSA/SHA和SM2/3/4)
  • • 缓冲管理
  • • DMA
  • • DDR4/LPDDR4 支持
  • • 4KB LDPC(低密度奇偶校验编码)
  • • Flash控制器

后端为 NAND 物理接口,16通道/8芯片,每通道速率1600MT/s

SSDs(固态硬盘)通过硬件和软件组件的结合来提升数据存储性能

  • 前端(Front-End):SSD与主机系统之间的接口。
  • 闪存转换层(Flash Translation Layer, FTL):处理诸如磨损均衡、坏块管理、逻辑到物理地址转换等任务。
  • 后端(Back-End):管理NAND闪存上的数据存储和检索。
  • 垃圾回收(Garbage Collection, GC):识别并合并碎片数据,通过擦除包含有效和删除数据的块来释放SSD中的空间。

图示 SSD 写入/读取 数据过程流。

图示传统文件系统下Host读取文件的工作流:

  1. 1. 在缓存中根据目录树查询文件(CPU);
  2. 2. 未果则通过文件系统的 super block -- index node 到SSD的数据块中读取数据。

将文件系统分成2个模块

  • • 文件读取
  • • 指令执行

Note:鹏弟对这页材料看了很久,大概能理解作者的意思,将文件系统(部分)功能下沉到SSD,将其定义成分布式文件系统,这和朴素的计算型存储概念还是有区别的。

支持双命名空间

  1. 1. 标准NVMe命令 的数据命名空间-NS0
  2. 2. 用户定义的NVMe命令的数据命名空间-NS1

Note:区分出用户定义的NVMe指令命名空间,从而实现自定义场景功能。

SSD中的文件系统 - 优势

  • • 文件系统在SSD内部运行,减少了主机上的CPU时间消耗。
  • • 数据通过高速DMA而非CPU传输。
  • • 文件系统与SSD缓存空间的管理同步,减少冗余计算和内存开销。

性能优势

图比较了普通文件系统和文件系统SSD在缓冲分配次数、数据拷贝次数和主机CPU任务方面的性能差异。文件系统SSD在缓冲分配和数据拷贝方面都有显著优化,分别减少了33%和50%的开销。此外,文件系统SSD将大部分主机CPU任务简化为NVMe VU命令,进一步减少了主机的处理负担。通过使用DMA来执行数据拷贝操作,进一步减轻了CPU的负载,提高了系统的整体性能

扩展场景-数据库SSD

创建新命名空间NS2,用于SSD中数据库的交互。

数据库SSD架构中的直接交互方式。通过将数据库连接到文件系统SSD中的NS2命名空间,数据库可以绕过传统的数据处理流程,直接与文件系统交互。这种设计减少了数据读写的延迟,提高了数据库访问的效率,非常适合高性能数据库应用场景。

扩展场景-更多计算型SSD

可在SSD中集成更多专用功能,实现更多计算型存储任务。

总结

  1. 1. 分布式文件系统可以提高性能和方便实施保护措施。
  2. 2. 文件系统在SSD中操作,减少了CPU时间成本。
  3. 3. 数据通过高速DMA传输,而不是CPU。
  4. 4. 同时管理文件系统和SSD缓存空间,减少冗余计算和内存开销。
  5. 5. 直接访问数据库可以降低读写延迟。
引用链接

[1] STARBLAZE: https://metaso.cn/s/XusVTc7

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
FPGA实现高带宽NVMe SSD读写
近期实验室项目需对2GB/s的高速数字图像数据实时存储,后续数据带宽将提升至30GB/s。经调研,SATA协议的固态硬盘理论存储有效带宽为600MB/s,NVMe协议的固态硬盘理论带宽随PCIe协议而不同。NVMe协议的固态硬盘在PCIe Gen2、Gen3条件下,理论有效带宽分别为2GB/s、3.938GB/s。目前,NVMe SSD最高搭载PCIe Gen4通路,其理论有效带宽为7.877GB/s。
数字积木
2021/08/19
4.9K0
FPGA实现高带宽NVMe SSD读写
FPGA纯逻辑实现高带宽NVMeSSD读写
在两年之A前的帖子《FPGA实现高带宽NVMe SSD读写》中,我们实现了一个基于PS和PL端的高速NVMe SSD IP。这个IP在我们自己的系统中使用正常,但是由于该IP使用了PS端资源,在与其他应用系统集成时遇到了麻烦。为了保护自有的设计,需要独占PS端的一个ARM处理器,这使得该IP在与其他项目集成时,使用很不方便。除此以外,原方案IP写SSD硬盘的最大速度约为2.8GB/s,而PCIe Gen3条件下理论有效带宽为3.938GB/s,基于x86的PC测速一般为3.6GB/S,FPGA的实现方式与理论速度以及x86平台的速度存在一定的差距,因此希望进一步提高IP的硬盘的读写速率。
用户10711701
2023/08/21
1.5K0
从新手到架构师:Web服务器如何实现大文件跨节点传输
看过一个文章 HTTP 断点续传(分块传输)我了解, 但是让我按照他们做法 八股文说出,我不愿意,说不出口。
早起的鸟儿有虫吃
2025/06/28
800
从新手到架构师:Web服务器如何实现大文件跨节点传输
原来PCIe这么简单,一定要看!
硬盘是大家都很熟悉的设备,一路走来,从HDD到SSD,从SATA到NVMe,作为NVMe SSD的前端接口,PCIe再次进入我们的视野。作为x86体系关键的一环,PCIe标准历经PCI,PCI-X和PCIe,走过近30年时光。其中Host发现与查找设备的方式却一脉沿袭,今天我们先来聊一聊PCIe设备在一个系统中是如何发现与访问的。
Linux阅码场
2019/07/08
14.1K1
FDP与SSD主控创新
按:本文含两单元,前半部分介绍数据中心SSD发展趋势及FDP技术在SSD领域应用价值,后半部分介绍FADU 在SSD主控领域技术创新及发展路线.
数据存储前沿技术
2025/02/11
3460
FDP与SSD主控创新
SATA、mSATA、M.2、M.2(NVMe)、PCIE固态硬盘接口详解
固态驱动器(Solid State Drive),俗称固态硬盘,固态硬盘是用固态电子存储芯片阵列而制成的硬盘,因为台湾英语里把固体电容称之为Solid而得名。SSD由控制单元和存储单元(FLASH芯片、DRAM芯片)组成。固态硬盘在接口的规范和定义、功能及使用方法上与普通硬盘的完全相同,在产品外形和尺寸上也完全与普通硬盘一致。被广泛应用于军事、车载、工控、视频监控、网络监控、网络终端、电力、医疗、航空、导航设备等诸多领域。
全栈程序员站长
2022/08/10
29.7K0
SATA、mSATA、M.2、M.2(NVMe)、PCIE固态硬盘接口详解
FADU:SSD主控高效能耗管理
文章主要探讨如何通过采用新型节能固态硬盘(SSD)控制器来大幅提高数据中心的整体拥有成本(TCO)。
数据存储前沿技术
2025/02/11
2630
FADU:SSD主控高效能耗管理
忆芯科技沈飞:对标Intel与三星,做不一样的“国产替代”| 镁客请讲
近年,在以日韩半导体为主力且已经稳定成型的内存产品市场中,有一匹“黑马”——固态存储(SSD)技术杀出,并因存储的稳定性和技术的先进性倍受业内人士器重。
镁客网
2019/03/04
8990
忆芯科技沈飞:对标Intel与三星,做不一样的“国产替代”| 镁客请讲
SMI:虚拟化环境下NVMe SSD性能优化
文档由Silicon Motion技术公司提供,关于如何在多虚拟环境中优化NVMe SSD I/O性能的技术。
数据存储前沿技术
2025/02/11
2690
SMI:虚拟化环境下NVMe SSD性能优化
Bill Gervasi:NVMe-Over-CXL 怎么落地?
按:本文是Bill老先生关于CXL场景和落地,在FMS-24上的发言材料,文中绝大部分直译作者观点,鹏弟延申的思考均以Note标出,建议阅读文末Bill 另两篇关于DRAM的介绍,循序渐进再来读,会更有感觉。
数据存储前沿技术
2025/02/11
2460
Bill Gervasi:NVMe-Over-CXL 怎么落地?
Samsung:大容量QLC-SSD 的若干问题
固态硬盘(SSD)作为高性能存储的主流选择,其容量也在不断突破极限。为了满足这一需求,存储行业正积极推动更高密度 NAND 闪存技术的应用,其中四层单元(QLC)技术因其更高的存储密度而备受关注。然而,QLC 技术在带来容量飞跃的同时,也带来了性能、耐用性和服务级别协议(SLA)等方面的挑战。理解这些挑战并探索相应的解决方案,对于充分发挥高容量 SSD 的潜力至关重要。本文将深入探讨高容量 QLC SSD 的技术特性、面临的挑战,以及行业为应对这些挑战所做的努力,特别是大块大小(LBS)等创新技术如何影响未来的存储格局。
数据存储前沿技术
2025/05/06
2560
Samsung:大容量QLC-SSD 的若干问题
NVMe Over CXL SSD 概念、场景与价值
早期计算机为优化性能,内存与存储分离:内存高速低延迟服务CPU即时需求,存储大容量持久保存。大数据和AI兴起,传统架构瓶颈显现,数据激增,内存需求空前,PCIe扩展受限。CXL应运而生,统一CPU、内存、加速器、存储,使NVMe SSD与内存紧密协作,SSD DRAM可扩展为HDM,提升速度、降低延迟、实现内存池化和动态分配,提高效率。本文将剖析NVMe over CXL原理、优势及应用,阐述其如何革新计算存储,尤其应对AI高性能大容量需求。
数据存储前沿技术
2025/04/13
3180
NVMe Over CXL SSD 概念、场景与价值
NVMe SSD 开发工具:NVMeVirt
文档介绍NVMeVirt,一个基于软件的虚拟NVMe设备模拟器,及其在加速存储系统研发中的应用。
数据存储前沿技术
2025/02/11
4830
NVMe SSD 开发工具:NVMeVirt
【论文阅读】DDS:基于DPU优化的分离式存储(数据库领域从事人员也可从本文获益)
今天我们来看一篇由多伦多大学、微软亚洲研究院的研究人员发表的文章《DDS: DPU-optimized Disaggregated Storage》。
霞姐聊IT
2025/06/09
1840
【论文阅读】DDS:基于DPU优化的分离式存储(数据库领域从事人员也可从本文获益)
SSD写放大与数据放置技术:从原理到实践
数据的增长速度呈指数级上升,云原生时代的到来进一步加剧了对高性能、低成本存储解决方案的需求。
数据存储前沿技术
2025/02/11
2660
SSD写放大与数据放置技术:从原理到实践
NVMe + CXL 场景案例分析
在之前整理的材料中,介绍了 NVMe 作为专门为SSD优化的存储访问接口(协议),为存储系统的高效访问提供通信基础。 CXL 是一种高速接口协议,旨在连接计算、内存和存储资源,提升数据中心的工作效率。它不仅是一个通信协议,还支持多种设备间的互操作性,允许灵活的资源分配和管理。
数据存储前沿技术
2025/02/11
3130
NVMe + CXL 场景案例分析
Marvell:数据管道与高性能SSD
过去两年,业界对AI 训练场景异常关注,随着热度不断降低,重新回顾AI整个数据生产流,前端的数据处理平台作为训练的数据源,其处理效率和准确性是后向操作的关键,应该更加关注大数据平台的长期建设和维护。
数据存储前沿技术
2025/02/11
1420
Marvell:数据管道与高性能SSD
【合集】深入理解大容量SSD设计
随着数据量的爆炸式增长,对SSD容量的需求也日益迫切。如何在有限的物理空间内,进一步提升SSD的存储容量,同时兼顾性能与成本,成为了业界亟待解决的关键问题。
数据存储前沿技术
2025/04/24
2430
【合集】深入理解大容量SSD设计
NVMe接口优化:HDD存储的未来之路
在生成式AI和大数据时代,存储系统的性能和效率变得至关重要。传统的SATA和SAS接口已经无法满足现代数据中心对高吞吐量和低延迟的需求。NVMe(非易失性内存 express)作为一种新兴的存储接口,正在逐步取代这些传统接口,特别是在大容量存储系统中。本文深入探讨了NVMe接口在HDD(硬盘驱动器)中的应用,分析了其如何通过统一存储堆栈、优化拓扑结构以及引入新技术(如eBPF、CMB、HMB等)来提升存储系统的性能、降低功耗和总拥有成本(TCO)。通过多个实际案例和技术细节,本文为读者展示了NVMe接口如何推动存储技术的革新,并为未来的数据中心和AI应用提供了强有力的支持。
数据存储前沿技术
2025/02/26
3282
NVMe接口优化:HDD存储的未来之路
一种不带CPU的DPU架构:Hyperion
人类自诞生之日起,就常常因为一些事情经常这样或那样做而形成一种惯例,我们称这种惯例为习惯。CPU就是这么一种产物,什么都可以做,灵活,好用。但随着定制化芯片的不断发展,是否真的需要CPU逐渐成为一种值得考虑的问题。尤其在定制计算领域,CPU的计算能耗比过高已经成为事实,甚至有几个数量级的差别。如本公众号之前曾发布的唤醒芯片的介绍"小爱同学"之类语音唤醒芯片相关技术介绍,都是不带CPU的超低功耗芯片。那么,在常常以功耗过大被诟病的数据中心应用日益频繁的DPU芯片,是否也可以不带CPU呢?本文介绍一篇2022年5月19日发布在https://arxiv.org/pdf/2205.08882.pdf网站上的一篇文章。
网络交换FPGA
2022/08/30
1.3K0
一种不带CPU的DPU架构:Hyperion
推荐阅读
相关推荐
FPGA实现高带宽NVMe SSD读写
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档