按:之前学习材料整理过大量海外厂商方案,随着不断推进,不少国内优秀方案也逐渐映入眼帘。抱着学习的心态尝试理解要义,如有误,欢迎指出,多交流,才能进步!
1. 长期以来,文件系统作为OS调用文件的元数据管理层,与OS内核紧密交互,用户态文件系统也不是新鲜事,这些方法都需要将数据读取到Host上分析,数据迁移量不容小觑,数据管理任务能进一步下沉吗?
2. 将FS部署到先进SSD上组成分布式的SSD文件系统,优化数据读取过程。
关于 STARBLAZE[1] (忆芯科技)
北京忆芯科技有限公司(Starblaze)成立于2015年底,是一家专注于芯片及解决方案的高科技企业。公司致力于成为世界级的大数据芯片及方案公司,业务覆盖消费级和企业级市场,主控芯片和解决方案是其核心业务方向。忆芯科技总部位于北京,并在上海、成都、厦门和深圳设有研发中心和客户技术支持中心。
随着PCIe速度的提高,SSD控制器的能力变得越来越强大:
特点列表:
左下角显示 PCIe接口带宽升级路线。
右下角显示主控 STAR2000 结构拓扑。
前端为:PCIe Gen4 接口,可选4通道或2通道x2
中间为主控上各种模块组件:
后端为 NAND 物理接口,16通道/8芯片,每通道速率1600MT/s
SSDs(固态硬盘)通过硬件和软件组件的结合来提升数据存储性能
图示 SSD 写入/读取 数据过程流。
图示传统文件系统下Host读取文件的工作流:
Note:鹏弟对这页材料看了很久,大概能理解作者的意思,将文件系统(部分)功能下沉到SSD,将其定义成分布式文件系统,这和朴素的计算型存储概念还是有区别的。
Note:区分出用户定义的NVMe指令命名空间,从而实现自定义场景功能。
SSD中的文件系统 - 优势
图比较了普通文件系统和文件系统SSD在缓冲分配次数、数据拷贝次数和主机CPU任务方面的性能差异。文件系统SSD在缓冲分配和数据拷贝方面都有显著优化,分别减少了33%和50%的开销。此外,文件系统SSD将大部分主机CPU任务简化为NVMe VU命令,进一步减少了主机的处理负担。通过使用DMA来执行数据拷贝操作,进一步减轻了CPU的负载,提高了系统的整体性能。
创建新命名空间NS2,用于SSD中数据库的交互。
数据库SSD架构中的直接交互方式。通过将数据库连接到文件系统SSD中的NS2命名空间,数据库可以绕过传统的数据处理流程,直接与文件系统交互。这种设计减少了数据读写的延迟,提高了数据库访问的效率,非常适合高性能数据库应用场景。
可在SSD中集成更多专用功能,实现更多计算型存储任务。
[1]
STARBLAZE: https://metaso.cn/s/XusVTc7