Nvidia 英伟达又出新品了 就在近日发布了全新的 AI GPU,名为 B200 GPU,这款 GPU 拥有 2080 亿个晶体管,性能高达 20 petaflops 的 FP4 马力。不止,还有两个 B200 GPU 与单个 Grace CPU 结合的 GB200,可以为 L L M 推理工作负载提供高达 30 倍的性能,同时还有可能显著提升能效。
英伟达表示,与 H100 相比,GB200 可以将成本和能耗降低多达 25 倍。这意味着用户在保持高性能的同时,能够显著节省成本和能源消耗。
关键区别之一是第二代 Transformer 引擎,通过将每个神经元的位数从每个神经元的位数 8 位减少至 4 位(故称 FP4 的 20 petaflops),使计算、带宽和模型尺寸加倍这种拉高性能和效率的组合为用户提供了更好的灵活性和竞争优势。同时,由于能耗的大幅降低,用户还可以为环境做出积极的贡献,降低整体的碳排放量。
总的来说,Nvidia 的 GB200 提供了一种创新的解决方案,不仅可以显著提升性能,而且可以在减少成本和能耗的同时实现更高的工作效率。同时,由于能耗的大幅降低,用户还可以为环境做出积极的贡献,降低整体的碳排放量。
领取专属 10元无门槛券
私享最新 技术干货