8 月 20 日消息,在2021年英特尔架构日上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 Raja Koduri 连同多位英特尔架构师,介绍了面向 CPU、GPU 及 IPU 的重大技术架构改变和创新细节。
其中,英特尔第一次深入介绍了其首个性能混合架构 CPU Alder Lake,它不是简单地提供下一代更强大的 CPU 内核,而是重构了多核架构,集成了两款不同的 x86 内核(能效核和性能核)以及硬件线程调度器(在合适的时间把合适的线程分配给合适的内核),基于 Intel 7 制程工艺打造。据悉,基于 Alder Lake 的系列产品将在今年开始出货。
新的 x86 性能核(曾用代号 “Golden Cove”),是英特尔迄今为止性能最高的 CPU 内核,内置 AI 加速技术,用于学习推理和训练。与第 11 代酷睿架构(Cypress Cove 内核)相比,相同频率下,性能核在一系列工作负载上平均提升了约 19%。
而新的 x86 能效核(曾用代号“Gracemont”)为规模化处理而设计,旨在推动每瓦多核性能突破极限。对比英特尔迄今为止最多产的 CPU 微架构——Skylake,能效核在提供同样的单线程性能时,功耗仅为 Skylake 的 40%不到。与运行四个线程的两个 Skylake 内核相比,四个能效核在性能提升 80%的同时功耗更低。
值得一提的是,英特尔通过与微软合作,专门优化了新的 Alder Lake CPU 和硬件线程调度器在 Windows11 上的性能。
“在整个 Windows 11 的开发周期中,我的团队一直与英特尔同事合作,改进并优化我们即将推出的操作系统,使其充分利用‘性能混合’架构的优势,尤其是硬件线程调度器。大部分工作围绕操作系统线程调度程序展开,内核组件决定运行哪些线程在哪里运行。”微软 Windows 内核团队开发经理 Mehmet Iyigun 介绍道,除了线程调度之外,Windows 11 还利用硬件线程调度器的提示决定挂起或唤醒哪些内核,以节省电量。
在 GPU 方面,英特尔很早就与开发者和游戏引擎厂商展开合作,共同为游戏发烧友设计新的独立 GPU。本次架构日英特尔发布了全新的独立显卡微架构 Xe HPG,专为游戏和创作工作负载提供发烧级的高性能。基于 Xe HPG 的 Alchemist Soc(之前代号为 DG2)将于明年第一季度上市,并采用新的品牌名英特尔®锐炫™。
而另一个面向百亿亿次计算的 GPU——Ponte Vecchio,是英特尔至今最复杂的 SoC,基于 Xe HPC 微架构,并采用多种先进的半导体制程工艺、英特尔的 EMIB 技术以及 Foveros 3D 封装技术,包含 1000 亿个晶体管,提供业界领先的浮点运算和计算密度。英特尔官方甚至将其比喻为“堪比登月难度创新后的一款产品”。
在架构日上,英特尔表示,早期的 Ponte Vecchio 芯片展示了领先的性能,在流行的 AI 基准测试中创造了推理和训练吞吐量的行业记录。比如 A0 芯片性能提供了高于 45 TFLOPS 的 FP32 吞吐量,高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽。同时,英特尔分享了一段演示视频,展示了 ResNet 推理性能超过 43000 张图像/秒和超过每秒 3400 张图像/秒的 ResNet 训练,并且这两项性能都有望实现行业领先。
Ponte Vecchio 已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio 预计将于 2022 年面向 HPC 和 AI 市场发布。
此外,英特尔还发布了专为数据中心设计的下一代处理器 Sapphire Rapids,它的核心是一个模块化的分区 SoC 架构,具有异构计算基础设施的架构基础,并搭配最高的计算密度和内存带宽。Sapphire Rapids 也是基于 Intel 7 制程工艺技术,并采用新的性能核微架构。
IPU 方面,英特尔与一家云服务提供商合作架构了 Mount Evans 来减轻基础设施负载。Mount Evans 也是英特尔首款专用 ASIC IPU,融合了多代 FPGA SmartNIC 的经验。
最后,英特尔还提及了oneAPI,这是英特尔在 2019 年推出的开源软件解决方案,它可以提供单一、开放和统一的编程模型,能够简化跨不同架构的开发工作。除此之外,英特尔也提供了商用部署的完整 oneAPI 堆栈,包括基本的 oneAPI 基础工具包,它在规范语言和库之外增加了编译器、分析器、调试器和移植工具。据 Raja 介绍,自从 2020 年 12 月发布第一个版本以来,超过 20 万名开发者在获得 Xe HPC 之前就已经安装了英特尔的 oneAPI 产品,市场上有超过 300 个采用 oneAPI 统一编程模型的应用软件。今年 5 月份发布的 1.1 版临时规范为深度学习工作负载和高级光线追踪库添加了新的图形接口,预计正式的 1.1 版将在年底完成。
领取专属 10元无门槛券
私享最新 技术干货