出于通勤等因素,建议型号
M1芯片的mbp非常强大,发热不严重,甚至在Air版没风扇.
主要介绍主机GPUx1/GPUx2的配置,GPUx4/GPUx8的配置后面介绍,建议结论如下,3080版本总计13000左右,3090版本总计21000左右(显卡加6000左右换成3090,电源换成1000w,其他不需要变即可)。
CPU/主板:5900x+微星MAG B550M MORTAR WIFI迫击炮主板.==> 3200元
CPU散热:利民Frozen Magic EX 240水冷. ==> 390元
硬盘:三星PM9A1 1T 809 + WD西数sn570 2T.==>1300元
内存:海盗船复仇者内存条32G x2. ==>900x2=1800元
GPU:耕升3080 12G ==>5200元
电源:长城850w金牌全模组==> 560元
机箱:300元左右支持240水冷的机箱即可=>200元
这里参考CPU天梯图 https://zhuanlan.zhihu.com/p/109042798 常看常新
CPU天梯图是按照CPU的跑分进行排序,进行综合性能对比、反映CPU性能优劣的一种量化标准。CPU主要有两家品牌: Intel(触点式接口)和AMD(针脚式接口),此部分主要介绍Intel/AMD主流系列,其他系列会在后介绍。
CPU接口不同搭配的主板也不同,不同级别的CPU搭配不同级别的主板芯片组。eg:
https://zhuanlan.zhihu.com/p/429099752
intel 12代酷睿系列CPU,需要搭配不同后缀标代表不同意思,
一般主机要搭配GPU,因此不需要考虑带K的系列。且长时间运行不建议超频。
需要搭配的主板型号
1)B660
2)Z690
https://www.gamersky.com/news/202204/1479779.shtml
AMD锐龙5000系列,后缀含义
1)X: 高端处理器
2)G: 带核显…
需要搭配的主板型号
1)B550: 华硕TUF重炮手、微星迫击炮…
2)X570:
主板中比较好的牌子:华硕、技嘉、微星. 中高端都是可以选择的. 不同的主板的版型,即大小:
在AI训练、测试用途中,CPU部分主要考虑的是核心&线程数量。建议大家选购AMD 5900x型号,散片/盒装都可,CPU出故障率极低。(不推荐12代酷睿的原因是 在Ubuntu系统中版本适配做的不好,比如大小核小分配任务的故障等)
另外,主板一定要选择带蓝牙/wifi的配置,这样可以剩下一个PCIE插口,后续扩展硬盘非常方便的。
CPU散热部分主要考虑的是噪音,风冷噪音实在太大,而水冷的风险是漏液。建议选购推荐品牌的240/360水冷。
硬盘比较好的牌子:三星、铠侠、西部数据,硬盘按照接口主要分为两种
在AI训练、测试用途中,硬盘部分主要考虑的是速度,容量其次,有时候GPU显存的利用率很低,很大的程度是硬盘IO瓶颈。由于B550/B660主板预留的PCIE接口只有两个,所以推荐采用2T NVME PCIE3.0(装系统) + 1T NVME PCIE4.0. 存放有价值的数据集跟训练checkpoint是完全没问题的。后续如果想增加容量完全可以用PCIE扩展卡上面额外加固态即可。关于容量,比如imagenet 138G. COCO 27G. 1T + 2T的配置完全够用。
PCIE扩展卡的使用
# 格式化新硬盘并挂载到新目录的方法
df –h # 查看分区以及挂载点
fdisk –l # 查看服务器上所有硬盘状态(已安装和未安装)
mkfs -t ext4 -c /dev/sdb1 # 格式化硬盘
mount /dev/nvme1n1 /home/wlsh/ssd # 创建新目录作为新硬盘挂载点
vim /etc/fstab # 开机自动挂载
/dev/nvme1n1 /ssd ext4 defaults 0 0
内存比较好的牌子:英睿达、海盗船、芝奇都可。
原则:内存的容量 > 2*GPU显存,越高越好
在AI训练、测试用途中,内存部分主要考虑的是容量,数据的处理流程是硬盘=>内存=>GPU显存,一定量的内存能保证进行数据预处理的时候能非常好的。频率不需要太高,建议适中3200即可,考虑到后续参加比赛需求。预算不足情况下32G即可。
可见FP16算力远远大于FP32。
GPU与Al训练、测试相关的参数:
推荐两款型号3080 12G / 3090 24G,建议预算充足选择3090
注意:同样的型号 3090 24G,半精度下71TFLOPS远远大于单精度35TFLOPS。因此,可以选择开启半精度训练。也就是同样场景下半精度训练速度比单精度快一倍。
2张2080ti+1200w 在满载跑模型的时候,主机断电重启的问题,经检查pytorch启动瞬时功率过大导致的。
电源建议:3080 12G 选用850w,3090选用1000w
牌子:振华、海韵都可
在第三代的Kepler架构里,FP64单元和FP32单元的比例是1:3或者1:24。
第四代的Maxwell架构里,这个比例下降到了只有1:32。
第五代的Pascal架构里,这个比例又提高到了1:2,但低端型号里仍然保持为1:32。
一般重点关注FP32峰值算力,与DL息息相关。
对于一些特殊的卡,例如T4专门用于推理,只需要关注FP16和INT8的算力即可。
从目前的实践来看,AI算法和传统HPC算法相比,对精度的要求低得多。因此我们看到很多AI芯片主要强调在FP16或者INT8中的精度。可以说,对目前AI芯硬件效率的提升,低比特精度有很大贡献。
构建合理的机箱风道能保证CPU跟显卡的温度,在确定自己机箱需求后,建议机箱安装若干风扇组件合理风道是非常重要的。
GPUx4 or GPUx8: 在多GPU情况下、保证机器的稳定性是至关重要的,这时候就要选择更高系列的CPU。
1)Intel至强系列 4210R, 5218R, 6230R
2)AMD霄龙系列 7320, 7402, 74F3…
这些CPU比如支持ECC自动纠错内存、支持的CPU通道数更多、支持更高的PCIE通道等。
Colab
AutoDL