机缘巧合,因为工作的关系,笔者得以能够接触搭建基于gpu的深度学习框架的整个过程。从攒机开始,笔者使用的机器是sugon的天阔系列W580,内存128g,可以使用的硬盘空间有5T左右。如下图所示,图中红色线框就是放置
Gpu的位置,其实W580系列是支持4路gpu的。接下来我们就需要将Tesla P4的显卡放置在插槽上,进行安装。
Tesla系列是nvidia系列里面比较高端的系列,价值不菲。接下里就需要重新安装操作系统了,鉴于ubuntu16.04的使用较为广泛,那就ubuntu16.04好啦。
为了不至于讲述的过于凌乱,还是画一个流程图比较好。
到这里,我们默认已经进行到第三个步骤,前面两个步骤已经完成。
配置ip
在配置ip之前,首先看看机器上面有多少个网卡
然后我们选择其中的一块网卡来做相应的配置
vim /etc/networl/interfaces
将eno1配置成为dhcp自动获取模式,完成以后可以运行ifup eno1,启动网卡服务。
接下来就可以使用ifconfig命令查看ip地址。
安装cuda
在安装cuda之前,首先需要确认GPU显卡是否安装成功,通过
lspci grep NVIDDA来查看,
后者使用命令nvidia-smi来查看
同样也可以看到GPU的信息。
安装显卡驱动
安装cuda,这个时候就按照nvidia的官网上的教程一步步来就ok啦。
不得不提一下,这里有两种方式去安装cuda,一种下载cuda的sh脚本进行online安装,另一种则是现将cuda的deb文件下载好,然后可以进行离线安装。
cuda Toolkit是nvidia提供的CUDA开发套件,其中包含了编写cuda程序所必需的库文件和头文件,以及一些辅助函数库。
安装cudnn
cudnn之所以这样命名,是因为后面三个字母dnn其实是deep neural network意思,顾名思义,就是基于CUDA Toolkit编写的专门面向神经网络的Gpu加速库。比如网络的feedforward和backward计算库等等。所以在此之前,需要去官网上下载相应的cudnn文件。
安装anconda
anaconda是python的一个集成开发环境,对于用户非常的友好,笔者非常喜欢这样的环境,所以就安装了相应环境。安装python2.7系列
wget https://repo.continuum.io/archive/Anaconda2-5.0.1-Linux-x86_64.sh
执行以上命令进行安装,该程序会自动的将python的环境变量写入到bashrc里面。
然后
更改配置
可以安装以上配置想做相应的改变
安装gpu-tensorflow
sudo pip install gpu-tensorflow
等待安装完成。
test环境
同样的可以在notebook中做一个测试。
哈哈,同样是可以的,那么,done!游戏时间到,请诸位尽情玩耍。
领取专属 10元无门槛券
私享最新 技术干货