英伟达原计划于2023年推出HGX H20、L20、L2三款GPU产品,可用于人工智能(AI)计算,但由于美国商务部2023年10月更新的高性能芯片出口管制措施,扩大了对华禁售的芯片范围,这一变动使得英伟达三款GPU的发布延期。
根据此前曝光的参数信息,英伟达HGX H20与H100、H200同系列,均采用英伟达Hopper架构,但显存容量增大至96GB HBM3,GPU显存带宽4.0TB/s。算力方面,该产品的FP8算力为296 TFLOPS,FP16算力为148 TFLOPS,仅为当今“最强”AI芯片H200的1/13。
HGX H20的优点是支持NVLink 900GB/s高速互联功能,且采用SXM板卡形态,兼容英伟达8路HGX服务器规格,便于集群AI大模型训练。从参数上看,该产品的性能密度、总算力完全符合美国出口管制规定。
另外两款GPU产品L20、L2均为PCIe 4.0 x16板卡形态,采用英伟达Ada Lovelace架构。这两款产品分别搭载48GB、24GB GDDR6显存,算力相比H20更低。
在美国对华出口管制措施生效后,英伟达先是在中国下架RTX 4090游戏显卡,随后推出缩水版RTX 4090 D,专为中国市场设计,CUDA核心数由16384个缩减至14592个,性能大约下降10%。
分析师郭明錤2023年12月28日发文透露,英伟达H20 AI GPU芯片有望于2024年第二季度开始量产,纬创为基板独家供应商。
领取专属 10元无门槛券
私享最新 技术干货