高性能计算(HPC,High Performance Computing) 的含义有很多,感觉最贴切的还是 Oracle中国中说的这句:
这么说可能还是有点难懂,用王总的话来说,就是 集中火力干事业!
一台计算机,我们平时用用 WPS 写写文档,玩玩英雄联盟什么的小游戏可能还很流畅;但是如果想要玩玩 “3A”大作,在我的世界中开个光影,可能会略有卡顿。
这时,有台式机的可能会想换个3090,有雷电3的笔记本可能会想外置一个显卡。可是,这些似乎都不是明智之举,毕竟一张显卡的价格也不是很友好。
但是,如果我们把笔记本和台式机连接在一起,把两台设备的算力叠加在一起,这样不就解决了吗?
说干就干,打开了笔记本和台式机,从淘宝上下单了一条双USB3.0 线就开始干了起来。可是尝试了一番操作之后,发现似乎不太行。如果那么简单地话,显卡应该就烂大街了。
集群(cluster) 就是一组计算机,通过某种方式作为一个整体,向用户提供更丰富的网络资源。
比如下图是甲骨文在开发者会议上使用1060台树莓派组成的超级计算机。使用树莓派集群,具有体积更小,功耗更低的优势。
说到高性能计算,就要说到计算机集群。计算机集群按照和功能主要分为以下几类:
高可用集群(HA) 是指是指以减少服务中断时间为目的的服务器集群技术。
当集群中有某个节点失效的情况下,其上的任务会自动转移到其它正常的节点上。还指可以将集群中的某节点进行离线维护再上线,该过程并不影响整个集群的运行。从而保证用户的业务服务程序能够对外提供不间断的服务。
负载均衡集群是指将工作量分配到多台计算机以达到最佳的资源利用率、最大限度地提高吞吐量、缩短响应时间和避免过载的计算机集群系统。
略
超级计算机代表着高性能计算系统的最尖端水平。随着计算机的处理能力的不断提升,超级计算机所能做到的事情也越来越多。