
全文概览
非结构化数据(如图片、视频、日志等)以每年55-65%的速度激增,占据数据总量的80-90%。然而,传统存储方案面临成本飙升、基础设施压力和安全风险的三重挑战。例如,43%的IT决策者担忧现有系统无法支撑未来数据需求,而勒索软件攻击导致的数据恢复成本更是雪上加霜。
在此背景下,IBM推出Deep Archive,通过磁带存储与云技术的深度融合,重新定义低成本、高安全的长期数据归档方案。其兼容S3 Glacier接口的架构,不仅降低冷数据存储成本达85%,更通过物理隔离(Air Gap)和弹性设计,为合规性、灾难恢复和可持续性提供创新解决方案。
阅读收获


图片主要展示了非结构化数据在过去十几年中的快速增长趋势,以及其在数据总量中的高占比。图片强调了非结构化数据增长带来的挑战,包括存储成本的增加以及IT基础设施可能无法满足未来需求的担忧。结构化数据虽然也在增长,但增速远不及非结构化数据。
===

介绍了数据存储的分类层级,根据性能和成本需求将数据分为不同的层级,从高性能的固态硬盘到低成本的磁带存储。同时,图片也强调了“活动归档”的重要性,它是一种将数据移动到辅助存储但仍能快速访问的策略,对于合规性、安全性、备份和灾难恢复至关重要。最后,图片指出云计算可以支持所有这些存储层级,并且像S3 Glacier(AWS 深度归档 对象存储服务)这样的云存储服务正成为归档解决方案的行业标准。
图片的主要内容是一个数据分类的层级结构,从上到下分为四个层级:

图片展示了当前组织在云存储方面的采用情况和面临的挑战。
绝大多数组织都在积极拥抱云计算,并且许多组织计划采用混合云模式。然而,安全性仍然是他们最主要的担忧。此外,超过半数的组织经历过网络攻击。在面临勒索软件攻击时,数据恢复是首要任务。尽管云被认为是数字战略的关键,但不断上升的云存储成本和难以预测的费用(如数据出口费)以及管理云支出是IT决策者面临的主要挑战。

图片中列出了人们对活动归档的七个主要期望:

图片介绍了IBM Deep Archive,这是一个为需要长期、低成本数据存储的组织设计的集成解决方案。它利用磁带存储的优势,提供高容量和吞吐量,同时保持易用性和易集成性。该方案与S3 Glacier兼容,可以显著降低冷数据的存储成本,并且不收取数据出口费用。

图片展示了IBM Deep Archive的配置信息:
图片右侧列出了一些关键指标和用途:
为什么磁带存储将磁带机和磁带盒分离?
磁带存储分离设计的原因:

图片展示了IBM Hyperswap的集成架构。它描述了一个混合云存储环境,其中客户通过S3接口管理数据。数据可以存储在本地的IBM Deep Archive(作为S3 Glacier的后端)、本地的主存储层(可以是文件存储或S3标准存储),以及异地的公共云存储(如AWS或Azure)。
这个架构旨在提供灵活的数据存储选项,可以根据数据的访问频率和成本需求将数据存储在不同的层级。IBM Deep Archive在此架构中扮演着低成本、长期归档的角色,并与S3 Glacier兼容。
为什么主流磁带存储库要适配S3存储协议?

图片概述了安装和配置IBM Deep Archive的步骤。安装过程包括物理安装磁带库和S3节点、连接必要的线缆(包括管理网络、数据网络、电源和库连接等)、更新软件和固件,以及配置网络设置。在客户配置阶段,需要设置用户账户并创建一个存储桶才能开始使用。
===
IBM 安装 (IBM install):

右侧图片介绍了Amazon S3 Glacier Retrieval存储类别,区分3类。
使用IBM Deep Archive,S3应用程序需要使用这个存储类别进行读写操作。
图片还列出了一些关于对象大小、账户和存储桶数量的限制,并对比了S3 Glacier的不同存储类别,强调Flexible Retrieval是成本和检索速度之间的一个平衡选项。

图片展示了IBM Deep Archive的管理工具TapeCloud Manager的界面和功能。该管理平台提供了全面的监控功能,包括系统健康、容量、吞吐量、节点和磁带库的状态等。
功能类别 (Feature Category) | 功能 (Feature) |
|---|---|
监控 (Monitoring) | 系统健康 (System health) |
事件通知 (Event notifications) | |
容量指标 (Capacity metrics) | |
吞吐量指标 (Throughput metrics) | |
TapeCloud 节点 (TapeCloud nodes) | |
磁带库 (Tape libraries) | |
磁带机 (Tape drives) | |
数据磁带盒 (Data cartridges) | |
清洁磁带盒 (Cleaning cartridges) | |
节点硬件 (Node hardware) | |
管理 (Management) | 系统更新 (System updates) |
库/驱动器固件 (Library / drive firmware) | |
证书 (Certificates) | |
用户账户 (User accounts) | |
库用户账户 (Library user accounts) | |
存储桶 (Buckets) | |
软件日志 (Software logs) | |
库/驱动器日志 (Library / drive logs) | |
节点日志 (Node logs) | |
加密设置 (Encryption settings) | |
NTP / 时间设置 (NTP / time settings) | |
网络设置 (Network settings) | |
服务操作 (Service actions) | 启动/停止/重启节点 (Start / stop / restart nodes) |
关闭/重启节点电源 (Power off / reboot nodes) | |
重新扫描库 (Rescan library) | |
禁用/启用驱动器 (Disable / enable drives) | |
更换数据磁带盒 (Replace data cartridges) | |
更换清洁磁带盒 (Replace cleaning cartridges) | |
验证磁带盒 (Validate cartridges) |

图片对比了IBM Deep Archive和传统的HDD存储在十年保留27 PB数据时的总拥有成本。
结果显示,与使用16 TB硬盘驱动器并每五年更新一次相比,使用IBM Deep Archive可以节省高达85%的成本。
此外,图片还指出,AWS S3 Glacier Flexible Retrieval的成本远高于AWS S3 Deep Archive,并且取回成本也更高。这强调了AWS S3 Deep Archive作为长期数据存储解决方案的成本效益。

定义了两种产品族,
Deep Archive (深层归档):
IBM Storage Scale + CES:
延伸思考
这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
原文标题:IBM Deep Archive-Revolutionizing Data Archiving