首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >GenAI时代,海量存储何去何从?

GenAI时代,海量存储何去何从?

作者头像
数据存储前沿技术
发布2025-10-09 11:12:08
发布2025-10-09 11:12:08
240
举报

阅读收获

  • 洞察GenAI驱动下的“冷数据”爆炸趋势,理解其对现有存储架构的颠覆性影响。
  • 掌握未来存储将从多层金字塔向“热/非热”二元模型演进的核心逻辑。
  • 认识到成本、能耗与合规性将成为存储决策的关键驱动因素,而非单一性能指标。
  • 重新评估磁带等介质在构建高效、可持续“活性归档”中的战略价值。

全文概览

生成式AI正以前所未有的速度推动全球数据量爆炸式增长,其中高达70%是“冷数据”。我们当前的存储策略是否能应对这种指数级增长?传统的数据金字塔模型正面临崩溃,高昂的成本、巨大的能耗和日益严格的合规性要求,正迫使我们重新思考数据存储的未来。面对这场“数据海啸”,技术从业者该如何布局?

👉 划线高亮 观点批注


在生成式AI的推动下,全球正在经历前所未有的数据爆炸,而其中绝大多数(约70%)是 “冷数据”。

  1. 数据结构的失衡: 绝大部分数据(70%)是“非热数据”,但其体量巨大,如同冰山水下部分,是数据管理的主要挑战。
  2. 增长的不可持续性: 历史上的数据年增长率(约25%)在未来将变得不可持续,预示着现有的存储技术和成本模型将面临崩溃的风险。
  3. 规模的量化警告: 从2025年的1.4ZB到2050年的40ZB,这个具体的数字预测直观地展示了“非热数据”未来惊人的增长规模。
  4. 解决方案的暗示: 幻灯片强调这些数据“应该被管理为无缝的活性归档(seamless active archive)”,这暗示存储行业需要发展新的技术和架构,以更经济、高效的方式来管理这些海量的、不频繁访问的数据,同时确保其可访问性。

关于作者:John Monroe

  • Gartner (1997年10月 - 2022年2月): 担任副总裁分析师 (VP Analyst)。在此期间,他负责研究和预测消费级及企业级存储市场的历史与未来。他的研究范围非常广泛,从组件(如机械硬盘HDD、固态硬盘SSD、磁带)到外部控制器(ECB)网络/光纤连接存储系统(即SAN),再到服务器直连存储(DAS)。
  • SYNNEX Information Technologies (1990年 - 1997年): 担任所有存储产品线的副总裁。SYNNEX 现已更名为 TD SYNNEX,是一家全球性的分销和制造服务公司。他负责HDD、控制器、子系统和磁带产品的盈利性转售和OEM集成业务。特别提到一点:与大多数行业分析师不同,Monroe 对他所研究的产品有过损益表级别的财务责任(balance-sheet accountability),意味着他有实际的商业运营和盈利经验。
  • Kalok Corporation (1988年 - 1990年): 担任北美销售总监。这是一家初创的HDD(机械硬盘)制造商。
  • Media Winchester, Ltd. (1983年 - 1988年): 担任部分所有者和总经理。这是一家存储产品分销商和集成商,也是希捷(Seagate)最早的“超级增值经销商(SuperVARs)”之一。
  • Electrolabs (1980年开始): 这是他职业生涯的起点。他在此销售集成电路(ICs)、电源、线缆、显示器、打印机、8英寸软盘驱动器和8英寸硬盘驱动器等多种电子计算相关的早期产品。

我们正面临着一个规模难以想象的数据时代,传统的数据增长和管理模式即将在2030年后达到极限,而生成式AI(GenAI)既是这场危机的催化剂,也必须成为解决危机的关键工具。

  1. 问题的严重性升级: 用“数据海洋”的比喻和超过百ZB级的设问,强调了数据规模已超出传统认知,其管理难度和不确定性极高。
  2. GenAI的双重角色: GenAI不仅是数据爆炸的“问题制造者”,更是在未来应对制造、成本、能耗和可持续性等多重限制时,提升存储效率所“必需的解决方案”。
  3. 增长模式的临界点: 明确指出2030年是一个转折点,之后超过25%的高速增长将难以为继,行业必须寻找新的、更可持续的发展模式。
  4. 数据产生的必然性: 强调了数据源(人、系统、传感器)的持续扩张是不可阻挡的,这使得存储效率的提升成为一个无法回避的紧迫课题。

当前企业存储策略存在严重的“介质错配”问题,导致了巨大的成本和能源浪费,这种模式在未来海量数据增长的背景下是不可持续的。

  1. 存储资源错配: 绝大多数(70%)的数据是访问频率极低的“活性归档”数据,但它们却被大量存储在为频繁访问而设计、成本高昂且能耗巨大的HDD和SSD上。
  2. 成本与能耗危机: 这种资源错配直接导致了企业在存储上的TCO(总拥有成本)过高,并消耗了不必要的能源,与全球可持续发展的趋势背道而驰。
  3. 磁带价值被低估: 磁带作为一种极具成本效益和能源效益的“活性归档”介质,其潜力远未被发掘,市场利用率严重不足(仅服务了21%的潜在数据)。
  4. 问题规模的指数级增长: 从2024年到2050年,“活性归档”数据的体量将增长超过35倍(从4.7ZB到170.4ZB),如果继续沿用当前的错误策略,其导致的成本和能源问题将演变成一场灾难。
  5. 行动呼吁(隐含): 整张幻灯片强烈暗示,企业必须重新审视其数据分层策略,将“活性归停”数据从昂贵的HDD/SSD迁移到更合适的介质(如磁带)上,以实现成本和能效的优化。

与近线大容量HDD相比,为什么云服务提供商,不使用磁带作为数据深度归档到存储介质?

云服务提供商(CSPs)实际上在使用磁带,但仅限于最深度的归档层(例如AWS Glacier Deep Archive),而之所以没有用它完全取代近线HDD,核心原因在于:接入延迟(SLA)、架构复杂性和总拥有成本(TCO)的综合权衡。

特性

近线大容量 HDD (用于冷存储)

磁带 (用于深度归档)

访问延迟 (SLA)

秒级到分钟级

分钟级到小时级

单TB介质成本

较低

最低

能耗 (活动时)

较高 (需要旋转)

较低

能耗 (静止时)

极低 (可休眠)

几乎为零 (离线存储)

基础设施

与数据中心同构,易于管理

异构,需要专门的磁带库和运维

访问模式

随机访问

顺序访问

理想场景

需要不频繁但快速访问的数据 (如:近几个月的日志、备份)

几乎永不访问,仅为合规或灾备而保留的数据 (如:医疗影像、金融交易记录)


传统的、拥有多个精细层级(热、温、凉、冷)的存储金字塔正在消亡。在GenAI和数据合规的驱动下,未来的存储架构将最终演变成一个简单的、“非黑即白”的二元模型。

关键信息提炼如下:

  1. 近期未来(2025-2040)是“混乱的过渡期”: 行业将经历一个由SSD、HDD、磁带和新兴技术混合组成的复杂、难以管理的时期。当前SSD成本不具备海量存储的优势,产业必须借助多层的存储金字塔来实现成本优化,这造成了数据管理的复杂性。
  2. 长期未来(2040-2050)是“伟大的二元化”: 存储架构将发生颠覆性简化,所有中间层级都将消失。中间层消失,需要的硬性条件:SSD成本与近线HDD接近。
  3. 最终的二元模型: 未来的数据中心将只存在两种数据状态:
    • 热数据(~30%): 存储在闪存或更快的介质上,用于需要极致性能的GenAI等实时业务。
    • 非热数据(~70%): 统一存储在一个巨大的“无缝活性归档”层中。
  4. 对“非热”数据层的新要求: 这个占70%的巨大数据池虽然“不热”,但必须具备“活性”,即能够在其内部的数据被需要时,实现快速、无缝的访问。这暗示着市场需要一种能以归档的成本,提供接近在线性能的新型存储技术。

未来存储架构的演进,将不再仅仅由性能需求驱动,而是被日益严峻的成本、功耗和合规性“三座大山”所共同塑造。数据存储的“蛮荒增长”时代即将结束,一个必须兼顾经济效益和环境可持续性的新时代正在到来。

  1. 性能过剩是一种罪: 强调了“用合适的工具做合适的事”的重要性。为绝大多数非热数据配备高性能存储在经济上和能源上都是不可持续的,智能的数据分层和管理是必然选择。
  2. 能源危机迫在眉睫: 存储的功耗已成为数据中心的沉重负担,并且还在被GenAI加剧。这个问题已经严重到让行业巨头开始探索自建核电站这种终极解决方案。
  3. 存储是环境问题的核心: 微软的数据明确指出,存储硬件的制造和运行是数据中心碳排放的主要来源。任何有效的“绿色计算”方案都必须从优化存储架构入手。
  4. 外部压力形成硬约束: 来自政府的碳排放法规和地区性的电力资源短缺,正在从外部给数据中心的扩张套上“紧箍咒”,迫使行业走向更高效、更绿色的技术路线。

Note

以上3张PPT,综合展示、预测 SSD、HDD、磁带、新兴介质存储,在过去5年及未来25年出货量和单位存储容量成本比较,未来很长一段时间行业对存储容量需求仍会持续扩大,市场需要围绕不同分层存储需求开发新兴存储介质,不断优化能耗和可持续性。

以下几点值得关注:

  • SSD总出货存量(EB)何时超越HDD?2035-2036 (还有10年时间)
    • HDD和磁带出货量在2036年之后快速下降
    • 新兴存储介质在2036年之后快速占据市场
  • SSD单位容量成本($/TB)何时与HDD相近?
    • 2025年 SSD/HDD = 8
    • 2035年 SSD/HDD = 2.2
    • 2045年 SSD/HDD = 1.53,此时SSD出货量是HDD 的18倍 SSD单位容量成本比HDD高在短期仍将是行业事实,但随着成本差距逐渐缩小,叠加能源效率优势SSD出货量有望快速超越HDD

延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  1. 在向“热/非热”二元存储架构过渡的“混乱期”中,企业应如何平衡现有投资与未来趋势,制定有效的存储策略?
  2. 除了磁带,还有哪些新兴存储技术有望满足“无缝活性归档”对成本、能耗和访问性能的综合要求?
  3. GenAI作为数据爆炸的催化剂,其自身在数据治理和存储优化方面,能发挥哪些具体作用?

原文标题:“Like Nothing We’ve Ever Seen Before”: The Growing Immensity of “Frostbitten” DATA in the Age of GenAI…[1]

Notice:Human's prompt, Datasets by Gemini-2.5-Pro

#FMS25 #新兴存储技术趋势

---【本文完】---


公众号:王知鱼,专注数据存储、云计算趋势&产品方案。

PPT取自 Furthur Market Research, LLC 分析师 John Monroe,,在FMS 2025 闪存峰会上的汇报材料。

👇阅读原文,查看历史文章,推荐PC端打开 💻。


  1. https://files.futurememorystorage.com/proceedings/2025/20250805_COLD-102-1_Monroe_2025-07-27-00.12.54.pdf ↩
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档