Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >BBCube 3D:使用WoW/CoW进行3D-DRAM封装

BBCube 3D:使用WoW/CoW进行3D-DRAM封装

作者头像
数据存储前沿技术
发布于 2025-02-11 11:12:52
发布于 2025-02-11 11:12:52
1550
举报

按:在3D-DRAM 封装领域,东京工业大学提出一种新的封装技术-BBCube,能够更有效地提高DRAM带宽且降低能耗。

问题意识

内存封装技术代次比较

  • • 对高数据带宽的需求正在增加
  • • 已经引入了HBM(高带宽内存)
  • • 在相同功耗下提供更高(相较于DDR)的带宽
  • • 2D传输方式限制了访问能耗的改进
  • • 异构3D集成
  • • 正在铺平通向10TB/s的道路

右图介绍了不同内存工艺下的位访问能耗密度(y轴)与内存带宽(x轴)的比较关系,可以得出:

  • • DDR (2D):基于2D的内存技术(较高能耗),内存带宽较低;
  • • HBM (2.5D):基于2.5D的高带宽内存技术(较低能耗),内存带宽较DDR有所提升;
  • • Heterogeneous 3D:异构3D集成(能耗进一步降低,带宽更高),且内存带宽有望突破10TB/s

图片展示了对高数据带宽需求的增长趋势以及当前技术的演变。HBM作为一种2.5D内存技术,在功耗和性能之间取得了较好的平衡,但仍受限于2D传输的限制。为进一步提升带宽和降低能耗,异构3D集成技术被提出,能够达到更高的带宽(如10TB/s)并实现更低的访问能耗。

异构3D集成挑战

  • • 散热(Cooling)
  • • xPU无法充分散热。
  • • 电力传输(Power delivery)
  • • TSV(硅通孔)的阻抗会导致电源电压下降和较大的电压波动。
  • • BBCube有潜力解决3D集成问题
  • • 密集的TSVs(硅通孔)。
  • • 薄芯片设计(Thin dies)。
表格:
  1. 1. 左侧列:Memories on top of xPU(存储器位于xPU之上)
    • • 结构:DRAM芯片堆叠在xPU上,存在散热问题。
    • • 散热:困难。
    • • 电力传输:容易。
  2. 2. 右侧列:BBCube 3D
    • • 结构:改进后的设计(DRAM芯片堆叠在xPU下方),散热得到解决。
    • • 散热:容易。
    • • 电力传输:容易。

图片重点分析了异构3D集成(3DI)技术的主要挑战,包括散热不足和电力传输问题。传统设计(存储器堆叠在xPU上)在散热方面存在显著困难,而电力传输相对简单。BBCube 3D结构通过密集TSVs和薄芯片的设计,有效改善了散热,同时保持了电力传输的优势,因此被认为是解决3DI挑战的潜在方案。

BBCube 3D 的结构

  • • BBCube 3D包括:

多个xPU芯粒(Multiple xPU chiplets)

最后一层缓存芯片(Last level cache die)

层叠式DRAM(Laminated DRAMs)

基底芯片(Base die)

  • • 堆叠方式:

通过WoW(Wafer-on-Wafer,晶圆对晶圆)和CoW(Chip-on-Wafer,芯片对晶圆)技术实现堆叠。

BBCube 3D结构通过堆叠xPU、缓存芯片、层叠DRAM和基底芯片,形成紧凑的3D集成设计。采用先进的WoW和CoW堆叠技术,确保高密度的集成。硅通孔(TSV)为层间提供了高效的电力和信号连接,这种设计兼具高性能与散热优化的特点。

BBCube 3D 的加工过程(CoW)

  • • 步骤 (1): Attach Face-down(芯片正面向下粘附)

将xPU芯片的正面朝下通过粘合剂固定到基板上。

  • • 步骤 (2): Molding(模塑)

对已粘附的芯片进行模塑以确保结构的稳定性。

  • • 步骤 (3): Bonding and wafer thinning(绑定与晶圆减薄)

将模塑的芯片绑定到基底晶圆(Base wafer)上,并对晶圆进行减薄。

  • • 步骤 (4): Litho, etching and liner deposition(光刻、蚀刻与衬底沉积)

在基底晶圆上进行光刻、蚀刻和衬底材料的沉积工艺。

  • • 步骤 (5): Cu ECD and planarization by CMP(铜电镀沉积与化学机械抛光)

通过铜电镀沉积(Cu ECD)填充电气连接点,并使用化学机械抛光(CMP)实现表面平整。

BBCube 3D 的加工过程(WoW)

  • • 步骤 (2c): Wafer thinning(晶圆减薄)

DRAM晶圆在附着到临时载体晶圆(Carrier wafer)上后,进行晶圆减薄处理。

使用临时粘合剂固定。

  • • 步骤 (2): Bonding and debond carrier wafer(晶圆绑定与载体晶圆移除)

将薄化后的晶圆与基底晶圆(Base wafer)绑定,然后移除临时载体晶圆。

  • • 步骤 (3): Litho, Etching and liner depo(光刻、蚀刻与衬底沉积)

在基底晶圆上进行光刻图案化、蚀刻工艺和衬底材料的沉积。

  • • 步骤 (4): Cu ECD and flattened by CMP(铜电镀沉积和化学机械抛光)

使用铜电镀沉积(Cu ECD)工艺填充,然后通过化学机械抛光(CMP)平整表面。

  • • 步骤 (9): Repeat step 6 to 8(重复步骤6到8)

在支持晶圆(Support wafer)上重复之前的关键步骤,逐步完成多个层的堆叠。

  • • 步骤 (13): Dicing and singulation(切割与分离)

在堆叠完成后,将晶圆切割成独立的单元(Dicing),并将每个单元分离(Singulation),形成最终的xPU、DRAM和基底芯片堆叠模块。

Note:材料中省去5-8技术步骤,估计是对关键步骤的保护。

BBCube 性能预估

BBCube 3D的性能提升:

相比DDR5:

  • • 带宽提升30倍。
  • • 访问能耗降低20倍。

相比HBM2E:

  • • 带宽提升4倍。
  • • 访问能耗降低5倍。
  • • 提出了一种异构3DI技术,称为BBCube 3D

结合了无凸点的WoW(晶圆对晶圆)和CoW(芯片对晶圆)工艺。

使用高密度、低电容的TSV(硅通孔)。

  • • BBCube 3D的优势

通过低温工艺实现高可靠性。

比DDR5带宽高30倍,访问能耗低20倍;比HBM2E带宽高4倍,访问能耗低5倍。

在一个DRAM立方体上堆叠45W功耗的xPU。如果堆叠9个BBCube(约为掩模版大小),总功耗可超过423W,显示强大的扩展能力。

总结

  • • BBCube 将HBM封装在计算单元下方,从而缓解因热量控制导致的内存数据失效;
  • • 介绍 BBCube 的封装过程(WoW);
  • • 比较了BBCube 与 DDR/HBM 工艺的带宽和能耗差异。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Chiplet通信桥接技术介绍及大厂方案分析(一)
今天接着翻译Flip Chip, Hybrid Bonding, Fan-In, and Fan-Out Technology这本书第五章Chiplet Communication(Bridge),篇幅比较长,分为上下两篇,上半部分翻译背景和技术细节,下半部分翻译Intel、IBM、AMD、TSMC等大厂的一些Chiplet技术方案。
光芯
2025/04/08
1240
Chiplet通信桥接技术介绍及大厂方案分析(一)
新加坡A*STAR IME:多芯粒(chiplet)异构集成互联技术(2.5D/3D封装、CPO)
随着生成式AI与高性能计算(HPC)对算力的需求呈指数级增长(年复合增长率超50%),单芯片晶体管密度提升面临物理极限与成本瓶颈。新加坡微电子研究院(IME)在2025年HIR年会上指出,通过多芯粒(Multi-chiplet)异构集成实现系统级性能突破,已成为半导体产业“后摩尔时代”的核心路径。该技术通过将逻辑芯片、存储芯片、光子器件等异构单元在2.5D/3D维度上集成,可在单个封装内实现超万亿晶体管协同,满足AI芯片对算力(Zetta Scale级)、带宽(百Tbps级)与能效(pJ/bit级)的极端需求。
光芯
2025/04/26
2550
新加坡A*STAR IME:多芯粒(chiplet)异构集成互联技术(2.5D/3D封装、CPO)
先进IC封装,你需要知道的几大技术
先进集成电路封装技术是“超越摩尔定律”上突出的技术亮点。在每个节点上,芯片微缩将变得越来越困难,越来越昂贵,工程师们正在把多个芯片放入先进的封装中,作为芯片缩放的替代方案。
IT大咖说
2020/10/19
1.6K0
先进IC封装,你需要知道的几大技术
【了不起的芯片 - 读书笔记】CPU 的制作流程 ( 晶圆制作 | 光刻机光刻流程 | 蚀刻过程 | 涂层过程 | 重复上述步骤若干次 | 芯片封装 )
晶圆制作是半导体芯片制造的关键过程,它涉及将硅晶片(或其他半导体材料)转化为可以用于集成电路制造的基础材料。下面是晶圆制作的主要步骤:
韩曙亮
2023/10/11
2.1K0
【了不起的芯片 - 读书笔记】CPU 的制作流程 ( 晶圆制作 | 光刻机光刻流程 | 蚀刻过程 | 涂层过程 | 重复上述步骤若干次 | 芯片封装 )
深入探讨芯片制程设备:从原理到实践
在现代科技领域,芯片制程设备是不可或缺的工具。这些设备充当着制造半导体芯片的关键角色,为我们的日常生活提供了无数的便利。本文将深入探讨芯片制程设备的原理、功能和实际应用,以揭示这一领域的复杂性和重要性。
海拥
2023/10/11
4340
世界首颗3D芯片诞生!集成600亿晶体管,突破7nm制程极限
---- 新智元报道   编辑:桃子 拉燕 【新智元导读】周四,英国的明星AI芯片公司Graphcore发布了一款IPU产品Bow,采用台积电3D封装技术,性能提升40% ,首次突破7纳米工艺极限。 全球首颗3D封装芯片诞生! 周四,总部位于英国的AI芯片公司Graphcore发布了一款IPU产品Bow,采用的是台积电7纳米的3D封装技术。 据介绍,这款处理器将计算机训练神经网络的速度提升40%,同时能耗比提升了16%。 600亿晶体管,首颗3D芯片诞生 能够有如此大的提升,也是得益于台积电的3D
新智元
2022/03/09
4690
美国先进封装制造蓝图(MRHIEP):高性能计算相关的先进封装及异质集成技术
MRHIEP(Manufacturing Roadmap for Heterogeneous Integration and Electronics Packaging,异构集成和电子封装制造路线图)项目是由加州大学洛杉矶分校(UCLA)的 Center for Heterogeneous Integration and Performance Scaling(UCLA Chips)和国际半导体产业协会(SEMI)合作开展的。该项目于 2023 年 12 月 6 日发布了一份多机构报告。这份报告是美国本土先进封装的快速启动指南,代表了约 100 名来自 40 多家公司、学术机构、产业联盟和政府机构的行业资深人士的共同努力。其目标是为美国制定一份可操作的先进封装路线图,基于异构集成路线图(HIR)并增添制造方法说明来实施 HIR。该项目专注于高性能计算(HPC)和医疗电子与混合封装等关键领域,旨在利用美国本土技能、能力和基础设施,构建具有多样性、稳健性和安全性的全球供应链。
光芯
2025/04/08
1460
美国先进封装制造蓝图(MRHIEP):高性能计算相关的先进封装及异质集成技术
CPU是如何制造出来的(附高清全程图解)
CPU是现代计算机的核心部件,又称为“微处理器”。对于PC而言,CPU的规格与频率常常被用来作为衡量一台电脑性能强弱重要指标。Intelx86架构已经经历了二十多个年头,而x86架构的CPU对我们大多数人的工作、生活影响颇为深远。
刘盼
2021/04/29
2.1K0
CPU是如何制造出来的(附高清全程图解)
芯片车间常用中英文对照术语
30. BOE:Buffered Oxide Etch,是HF与NH4F依不同比例混合而成。6:1BOE蚀刻即表示49%HF水溶液:40%NH4F水溶液=1:6(体积比)的成分混合而成。可腐蚀人体骨骼。
用户2760455
2022/06/06
4.4K0
芯片车间常用中英文对照术语
半导体激光器芯片减薄、拋光工艺
激光器都是在外延的基础上做出芯片的结构设计,外延厚度2寸的在350um,4寸的在460um左右,到芯片后期,都需要对晶圆进行减薄,厚度有做到80um的,也有120um的,通常为兼顾芯片性能和破片良率问题,100um的厚度成为常见厚度。
用户2760455
2022/11/15
1.2K0
半导体激光器芯片减薄、拋光工艺
IMEC:300mm硅光平台的64Gb/s O波段GeSi电吸收调制器EAM
IMEC最近在JLT发了个文章,介绍了他们在300 mm硅光平台上的O波段GeSi QCSE EAM的进展。高速EAM是CPO/OIO调制方案的一个重要选项,比MZ小,带宽密度大,比微环稳定,控制简单。但目前做得比较好的单次外延GeSi EAM都只能工作在L波段,与短距O波段标准不兼容,而通过多层堆叠的Ge/GeSi多量子阱结构,利用量子斯塔克效应实现光吸收边带实现强烈的光谱漂移,可以实现工作在O波段的GeSi EAM,但技术难度也挺大的。
光芯
2025/04/08
990
IMEC:300mm硅光平台的64Gb/s O波段GeSi电吸收调制器EAM
Chiplet通信桥接技术介绍及大厂方案分析(二)
上一篇介绍了Chiplet设计和异构集成封装的技术分类和实现手段,这一篇来看下大厂的chiplet方案。
光芯
2025/04/08
1180
Chiplet通信桥接技术介绍及大厂方案分析(二)
SK海力士HBM4将采用全新设计:通过3D堆叠整合在逻辑芯片上
11月22日消息,据韩媒中央日报(Joongang.co.kr)报导,韩国內存芯片大厂SK海力士正计划携手英伟达(NVIDIA)开发全新的GPU,拟将其新一代的高带宽內存(HBM4)与逻辑芯片堆叠在一起,这也将是业界首创。SK海力士已与辉达等半导体公司针对该项目进行合作,据报导当中的先进封装技术有望委托台积电,作为首选代工厂。
芯智讯
2023/11/23
3750
SK海力士HBM4将采用全新设计:通过3D堆叠整合在逻辑芯片上
TRENDFORCE:2025 DRAM市场预测
南亚科技(Nanya Technology Corporation)是一家总部位于台湾的半导体制造公司,主要专注于动态随机存取存储器(DRAM)的研发、生产和销售。南亚科技成立于1995年,隶属于台湾著名的远东集团,南亚科技是台湾地区唯一的纯DRAM制造商,并且是全球领先的DRAM供应商之一。
数据存储前沿技术
2025/02/11
2280
TRENDFORCE:2025 DRAM市场预测
手把手教你,19步从石头里抠出一块CPU
半导体产业中用的最多的是硅元素,而硅元素在地球上的储量仅次于氧元素,数据显示地球的硅元素含量在28%左右。得益于硅元素巨大的储量和良好的半导体性质,它也就成为了制作集成电路的最优秀的原材料。
新智元
2021/11/23
3710
NAND刻蚀设备市场的垄断将被打破?
随着摩尔定律的逐步失效,数字逻辑芯片和DRAM芯片随着制程工艺提升所带来的密度优势正在降低,成本却在高速提升。相比之下,NAND Flash闪存的情况却并非如此。与半导体行业的其他行业不同,NAND每年的成本都在大幅下降。
芯智讯
2023/08/09
3350
NAND刻蚀设备市场的垄断将被打破?
3D芯片技术颠覆计算的三种方式:AMD、Graphcore、英特尔各放大招
机器之心报道 机器之心编辑部 AMD、Graphcore 和英特尔 3D 芯片技术颠覆计算的方式。 高性能处理器研究表明,延续摩尔定律的新方向即将到来。每一代处理器都需要比上一代性能更好,这也意味着需要将更多的逻辑电路集成到硅片上。但是目前在芯片制造领域存在两个问题:一是我们缩小晶体管及其构成逻辑和内存块的能力正在放缓;另一个是芯片已经达到了尺寸极限。 摩尔定律。图源:wikipedia 光刻工具只能刻印大约 850 平方毫米的区域,大约是顶级 Nvidia GPU 的大小。 近几年,片上系统开发人员
机器之心
2022/04/02
3780
3D芯片技术颠覆计算的三种方式:AMD、Graphcore、英特尔各放大招
Yole:HBM与DRAM市场预测
YOLE Intelligence[1] 是一家专注于半导体存储器行业的领先市场研究和战略咨询公司。
数据存储前沿技术
2025/02/11
1620
Yole:HBM与DRAM市场预测
一种新型RDL PoP扇出晶圆级封装工艺芯片到晶圆键合技术
扇出型晶圆级中介层封装( FOWLP)以及封装堆叠(Package-on-Package, PoP)设计在移动应用中具有许多优势,例如低功耗、短信号路径、小外形尺寸以及多功能的异构集成。此外,它还可以应用于多种封装平台,包括PoP、系统级封装(SiP)和芯片尺寸封装( CSP)。这些优势来源于一种称为再分布层(Redistribution Layer, RDL)的先进互连技术。
用户4472150
2025/02/10
2070
一种新型RDL PoP扇出晶圆级封装工艺芯片到晶圆键合技术
摩尔定律未死:GPU架构师如何续写千倍性能神话
本文整理自NVIDIA 2025GTC讲座《GPU MODE at NVIDIA GTC 2025》:
GPUS Lady
2025/05/15
200
摩尔定律未死:GPU架构师如何续写千倍性能神话
推荐阅读
相关推荐
Chiplet通信桥接技术介绍及大厂方案分析(一)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档