近年来,“智能”一词被越来越多的应用在不同“场景”中,场景代表着用户体验和使用行为,同时也代表着更加完善的用户画像。经济高速发展的中国,也十分关注在各个场景中的“智能”应用,“智慧城市”逐渐上升为国家战略。
智慧城市是在新一代信息技术加速发展的背景下,充分利用物联网、云计算、移动互联等技术手段,对城市服务、社会管理等行为需求做出智能响应,围绕人类的“衣食住行”将商业、交通、医疗等城市的各个核心系统整合起来,以一种更智慧的方式运行的新型城市发展模式。
新时代下的智慧城市
智慧城市在早期发展过程中,更多的是关注基础设施和信息化,驱动力主要是源于计算机的软硬件技术和网络通信技术。而在未来由“智慧城市”向“智能城市”迈进的过程中,大数据和人工智能将发挥核心价值。
近年来,无人驾驶、人脸识别、智能客服、机器人、无人机、3D打印等人工智能业务正蓬勃发展,并逐步在智慧城市中推广和应用。这种新型的“超级智能城市”正在各个行业领域,跳脱传统智慧城市建设思维而快速发展。
超级智能城市可以更好的利用人工智能与数据,并且更加依赖于智能决策,从而减少人工干预,为城市更好的诊断问题和提出个性化解决方案。这样不仅使不同领域能够开放融合,同时可以使城市实现一体化,提高城市综合竞争力和市民幸福感受。
智慧城市、AI、网络
目前,AI在智慧城市上的应用越来越广泛,而其实现的三大要素是:算法、算力、数据,核心是深度学习。接下来,我们将深入分析一下网络在实现人工智能各个环节的重要意义。
硬件驱动
为了提高AI数据处理效率,存储和计算都在发生革命性的变化,存储已经从机械硬盘演进到闪存盘,时延降低了不止100倍。计算资源也已经采用了GPU甚至是专用的AI芯片,数据处理能力提高了100倍以上。随着存储和计算能力的大幅度提升,为了保证存储介质与处理器的及时协同,网络也必须与时俱进,把通信的时间降低到存储和计算的时间相当,才不会成为阻碍AI发展的“绊脚石”。
业务及算法驱动
传统业务模式依靠于编程运算系统,每次的计算结果基本不会依赖于网络通信。而AI则全然不同,AI是一个不断学习的系统,其算法是依赖于海量的样本数据和高性能的计算能力,基于目标优化,并且不断迭代收敛。
随着人工智能应用数量的快速增长,人工智能算法规模也不断增大。AI分布式计算在数据的并行处理和模型的并行计算中,每一个节点的通信延迟、数据丢失,都会影响AI计算迭代的收敛时长,从而影响整体任务的完成。所以,对网络的通信量、通信性能也提出更高的要求。低时延,无丢包,高带宽,无阻塞的网络,才能满足AI计算发展的需求。
高性能AI网络
网络在面向AI的架构搭建上,需要采用软硬件结合的组网方式,在单节点和整网的转发通道实行流量控制,构建高带宽、低时延、0丢包的、灵活可拓展的AI高速公路。
关于0丢包问题
不丢包以太网是AI计算的重要保障,采用PFC和ECN技术相配合方式可以很好的实现这一目标。
PFC是基于优先级的流量控制,当流量出现拥塞时,通过队列的反压机制,发送pause帧通知上游设备降速,防止缓冲区溢出产生丢包。
ECN技术在交换机检测到拥塞时,可以将报文ECN字段置位,精确通知源端降速,使得源服务器网卡更快地响应拥塞并降速,及时缓解网络设备的缓存拥堵,有效降低时延,提升应用性能。
通过PFC和ECN特性的合理部署,可以完美的为大规模AI计算提供高质量的通信通道。
网络架构
高性能的网络通信是由合理的网络架构、高性能的网络设备、以及高带宽的通信链路共同来保障的。在网络架构上,简单化和扁平化的架构,同时减少源端与目的节点的跳数、降低通信时间,是AI高速通信的必然选择。 在AI数据中心中,AI的流量主要体现在东西向,这时候SDN的应用,同时辅以Spine-Leaf硬件网络架构,可以使整张网络的流量模型像在一个无阻塞的交换设备中转发一样,实现高效高速的协同计算与存储之间的信息交换,保障东西向流量的高速低时延转发。
而且伴随着AI应用的快速发展,该网络架构可以在支持大规模组网应用的同时,保证网络规模可以随AI业务弹性拓展,完美的解决了传统高速网络与大规模组网不能兼顾的问题,并可以简化管理,实现智能运维,降低数据中心OPEX。
此外,要保证整网的低时延高速度AI通信,还需要合理的链路带宽和高性能的网络设备,25G/100G通信链路,可以提供各节点间的高速互联互通的通道。当然,大缓存、端口之间的um级的低时延、大吞吐量的节点设备也是是高速转发的重要保证。浪潮网络CN12900系列、CN9000系列高性能数据中心产品、以及智能SDN平台,可以帮助组建同时具备高吞吐、无丢包、及统一以太网架构等性能的高效网络,助力AI的高速发展。
本期嘉宾:王艳华 浪潮网络资深方案经理
领取专属 10元无门槛券
私享最新 技术干货