通过分析2024全国高性能计算学术年会日程,AI技术的发展呈现以下趋势:
1. AI与高性能计算深度融合
科学计算智能化:多个报告(如中科院计算所的超算生物模拟、崂山实验室的海洋模型)显示AI正深度嵌入气候预测、生物计算等传统科学领域,通过机器学习优化模拟精度,解决复杂系统问题。多个分论坛都提到了AI和大模型的应用,比如“人工智能增强的全球公里级分辨率气候模拟”和“大模型与科学智算联合驱动的电网运行体系初探”。这说明AI在科学计算和工程模拟中的应用越来越广泛,尤其是在处理复杂系统和大数据时,AI技术能够提升模拟的精度和效率。
大模型驱动算力升级:阿里云、蚂蚁集团等展示了大模型训练对算力的需求激增,推动超算中心向智算中心转型,万卡集群成为新常态,通信优化(如RDMA、在网计算)成为关键技术。
2. 异构计算与存算一体
硬件架构多样化:分论坛讨论申威、海光、寒武纪等国产芯片适配,强调跨平台编程模型(如SYCL、Triton)的重要性,需解决性能移植难题。主题论坛:如“异构计算软件栈与应用论坛”、“高性能异构计算与人工智能优化论坛”等,讨论了异构计算在AI中的应用和优化。报告:如“基于大语言模型的全自动CPU-FPGA异构硬件加速”、“ReGraph: 面向HBM-FPGA的异构流水图计算加速器”等,展示了异构计算在AI中的具体应用案例。赛力斯汽车提到了CAE的算力建设,中科院计算所讨论了国产超算系统,还有多个论坛涉及异构计算软件栈和性能优化。这意味着AI对计算资源的需求不断增长,推动了异构计算架构的发展,结合CPU、GPU、FPGA等不同处理器,以提升计算效率和能效。
存算一体技术突破:图计算、稀疏矩阵等场景推动近存/存内计算发展(如UPMEM PIM架构),减少数据搬运,提升能效比。有报告提到面向图计算的存算融合架构,以及在网计算技术。这说明为了减少数据搬运的开销,提高处理速度,存算一体的技术正在受到重视,尤其是在处理大规模图数据和实时推理时。
3. 绿色计算与能效优化
低碳算力成刚需:液冷技术分论坛、高能效计算论坛聚焦AI集群能耗问题,通过动态功耗管理、硬件-算法协同设计(如蚂蚁CodeFuse的自动调优)降低PUE。这是因为AI训练和推理消耗大量能源,提高能效是可持续发展的必要条件。
可持续边缘计算:研究可再生能源驱动的边缘节点任务卸载策略,平衡计算可靠性与能耗。
4. 超算互联网与算力网络
算力资源池化:超算互联网(曹振南报告)构建跨中心算力调度网络,支持“东数西算”,通过应用商城降低使用门槛。未来的算力资源将更加分布式和协同,通过互联网整合不同地区的超算中心,形成统一的算力服务平台,支持更广泛的AI应用。
SaaS化普及:并行科技、适创科技等推动CAE、材料模拟等工业软件上云,结合AI实现智能优化设计,降低企业研发成本。
5. AI工具链开源与生态共建
开源框架崛起:澎峰PerfXAPI、华为毕昇编译器探索AI与编译优化结合,寒武纪Triton挑战CUDA生态,推动国产算力生态闭环。开源生态和工具链的发展,比如PerfXCloud大模型开发与服务平台,以及多个关于编译器优化和自动调优的报告,显示AI技术的普及需要更易用的工具和平台,降低开发门槛,促进更广泛的应用。
领域专用语言发展:清华大学等研发面向物理方程求解的DSL(如OpenArray2.0),提升科学计算的抽象层级。
6. AI推动工业制造深度智能化
数字孪生深化:赛力斯汽车CAE算力建设、适创科技数值反应堆等案例显示,AI加速仿真迭代,实现产品设计-制造闭环。
工业知识嵌入模型:金风科技风电SaaS、树优智能优化平台将领域知识注入AI,提升工业场景的模型实用性。
7.高性能存储与数据管理的重要性
随着AI模型规模的增大,高性能存储和数据管理成为关键,特别是在大规模数据处理和模型训练中。主题论坛:如“大规模超算存储系统的长时间运行情况分析及问题思考”、“基于应用创新的下一代超算存储架构与技术实践”等,讨论了高性能存储在AI中的应用。报告:如“释放AI原生平台强大性能,加速智能模型训练”、“可计算的突发缓冲区:高性能计算场景下的新存储范式”等,探讨了高性能存储在AI中的重要性和优化方法。
结论:AI技术正从单点突破转向与算力基础设施、行业场景的深度整合,呈现“纵向深化(算法-硬件协同)、横向扩展(跨学科应用)、生态开放(开源工具链)、绿色集约(能效优化)”四大趋势,推动科研与产业进入智能计算新范式。
本文分享自 Dance with GenAI 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!