前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【硬件】生信专用高性能计算机配置指南(续):关于配置、CPU和机箱

【硬件】生信专用高性能计算机配置指南(续):关于配置、CPU和机箱

作者头像
Chris生命科学小站
发布2023-02-28 18:45:10
2.4K0
发布2023-02-28 18:45:10
举报
文章被收录于专栏:Chris生命科学小站五年归档

R程序跑得多了,自然而然会想搞一台高性能计算机(High Performace Analytic Computer,以下简称HPAC),毕竟经常好几G的数据读来写去,矩阵计算家常便饭,对CPU算力,内存和硬盘都有比较高的要求。

虽然HPAC相比每平米房价不算个啥,但时代的一颗灰落到个人身上都是一座山,因此不少小伙伴还是限于经济望而却步。但横向来看,毕竟一台好的游戏主机也要好几万;纵向来看,如果看远一点,购买HPAC和发文章的数量肯定是正相关的,或许可以和老板商量,从实验室或小组的经费里拨点赞助,或者下班后可以加班去开滴滴送快递呀,或者街头唱歌的时候脚下放顶帽子,反正办法肯定是有的啦。如果你继续往下看,那么我就假设你已经有办法解决了经济问题,接下来我们将讨论在1.5-2.5w的范围内配置一台HPAC如何选择性价比最高,以及需要考虑哪些问题。

之前站长也写了20k搞定生信服务器相关的内容,本次我们将讨论得更加深入和广泛一点。 20k搞定生信服务器购买、安装与配置攻略~

CPU

如果光说服务器,这个概念稍微有点局限,因为服务器强调稳定,一开机就5、6年不用关机的那种稳定,对CPU的性能的需求是放在稳定之后的。但讨论HPAC,首先还是要从CPU开始说起。

CPU当然是以多线程为佳,AMD的线程撕裂者(Threadripper)就是最好的选择,但Intel长于算法,在功率相对较低的情况下,通过优化算法也能达到四两拨千斤的效果,比如Intel著名的MKL库(Math Kernel Library)[1],后面我们还会出相关的评测。

假如仅仅是一般的ngs数据处理,其实1w左右就能搞定,但技术是在不断进步的,既然配置HPAC是一笔不小的投资,我们就应该稍微往前看一点。比如目前处理单细胞数据的10x Genomics 的 Cell Ranger ,它给出的最低配置要求是:

  • 8-core Intel or AMD processor (16 cores recommended)
  • 64GB RAM (128GB recommended)
  • 1TB free disk space
  • 64-bit CentOS/RedHat 6.0 or Ubuntu 12.04

结合1.5-2.5w的预算,我们就选择了中上游的AMD的线程撕裂者2950X(基频3.5G,16核/32线程,L2+L3缓存 40M,支持超频,TDP功率180W, 支持DDR-2933)和Intel的至强4212(基频2.2G, 12核/24线程, 16.5M 缓存, 支持超线程,TDP功率85W, 支持DDR4-2400)两款CPU为核心,配置了两款HPAC。

第一款是基于AMD CPU自行组装的一台HPAC,经过实际测试,兼容性良好,稳定且性能优异,具体配置如下:

价格不包含运费

参考价格:¥ 18000 + ¥ 8000(显卡可选)

第二款我们直接在戴尔官网选择了PowerEdge T640主机,由于经费有限,基本全部是按默认选项来的,具体配置如下:

价格包含包装和运费

参考价格:¥ 24999

经过测试,两款机器稳定性和兼容性都属上乘,实际性能第一款AMD主机要略胜一筹,我们后面还会推出详细的测评。

机箱

我们先来看看第一款机器的机箱,可以看到虽然比普通PC,但相比戴尔的塔式机箱还是要小巧很多的,而且显得那么低调有内涵。

(Air 540机箱正面图)

这是后视图,可以看到兼容和扩展能力也是很强的,虽然机箱不大,但最多可以安装4个显卡做GPU深度学习用,而且散热能力非常强,所以这款配置是一款经得起考验的配置。

(Air 540机箱背面图)

第二款戴尔主机就显得要大很多,长度达到了70cm,比普通冰箱还要长一截,而且重达40斤,加包装的话更重,要两个人才能抬得动。

(戴尔T640前视图)

打开机箱可以看到浓浓的服务器味道,布局敞亮,散热通道明显,扩能能力超强。

(戴尔T640开箱图)

那么每个朋友的情况是不一样,是选组装机还是品牌机,简单来说,我们以动手能力和对硬件了解的程度画一个XY轴,那么结果就显而易见了。

(选择组装还是品牌)

比较

总的来说,以AMD为核心的HPAC,优点是:

  • 性能强劲
  • 性价比非常好
  • 可选配的自由度大
  • 机箱小,不占地方

不足之处也是有的:

  • 功率大,比较费电,夏天散热是个挑战
  • 需要足够的硬件知识,因为市场上往往真货假货难以区分
  • 只能使用普通的内存,稳定性欠佳
  • 只能单CPU运行

这里有同学可能不理解普通内存为何会影响到稳定性。其实19年的时候基因学苑[2]就发现在普通高配置电脑上长时间运行GATK容易出错,最终确认是普通内存缺乏容错机制引起的,而服务器的内存,一般是带有寄存器和ECC的(简称REG ECC或RECC),可以自动纠错,从而保证在超长时间运行的时候内存内不会发生字节读写错误。因此基因学苑推荐如果是做临床数据的话,还是选择服务器为佳。

如果说选购服务器,戴尔自然是首选。虽然戴尔其实也是卖组装机,从各个厂家采购配件,自己组装后再卖给客户,但作为老牌电脑供应商,戴尔电脑的兼容性和稳定性口碑还是不错的。表扬的话先不说了,我们先从戴尔主机的缺点说起:

  • 机箱太大,占地方
  • CPU性能中规中矩,不如AMD
  • 整机价格较贵

当然,站长买的就是戴尔,站长对戴尔的优点自然最有发言权,比如:

  • 稳定,机箱散热性能好
  • iDRAC集成管理系统非常方便
  • 最多可以安装2个CPU,一共有24个内存插槽,扩展能力超强
  • 价格包含售前售后服务
  • 原生的磁盘阵列功能强大

最后,感谢唐渊博士为本文提供相关硬件信息和校对阅读,唐博还为喜欢自己动手组装的同学分别推荐了目前最新的 Intel 平台和 AMD 配置选购指南,后台回复:选购指南,即可下载。

后面我们还陆续有很多服务器相关内容,且听下回分解。

参考资料: 1.Using Intel MKL with R. 2019. https://software.intel.com/en-us/articles/using-intel-mkl-with-r 2.基因学苑:服务器就是一台高配置电脑吗?2019. https://blog.csdn.net/xxxie_/article/details/100133167

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Chris生命科学小站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • CPU
  • 机箱
  • 比较
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档