使用环境:腾讯云官方镜像centos8.2
nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和CUDA之前应先禁用nouveau。
查看系统是否正在使用nouveau
lsmod | grep nouveau
如果有显示内容,则进行以下的步骤进行禁用nouveau
新建一个配置文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在该配置文件中输入i,写入以下内容
blacklist nouveau
options nouveau modeset=0
保存并退出
:wq!
备份当前的镜像
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
建立新的镜像
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
重启
sudo reboot
最后验证,没有任何显示即为禁用成功
lsmod | grep nouveau
输入以下命令安装GCC与G++
yum install gcc
yum install gcc-c++
输入以下命令安装kernel-devel和kernel-headers:
yum install kernel-devel
yum install kernel-headers
使用如下命令查看显卡的类型
lspci | grep -i nvidia
root@VM-0-10-centos ~]# lspci | grep -i nvidia
00:08.0 3D controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)
这里可以看到我的显卡是Tesla T4 我们需要前往英伟达官网查看所支持该显卡的驱动版本
下载驱动文件 并上传到服务器中
cd跳转到驱动所在的目录下,并给予执行权限
chmod u+x NVIDIA-Linux-x86_64-450.172.01.run
完成后执行安装脚本
sudo ./NVIDIA-Linux-x86_64-450.172.01.run --kernel-source-path=/usr/src/kernels/4.18.0-348.7.1.el8_5.x86_64
输入 nvidia-smi
如果看到以下输出则代表安装成功
在英伟达官网下载对应版本的CUDA CUDA Toolkit 11.0 Download | NVIDIA Developer
进行如图所示选择 并且复制到服务器内运行
下载完成之后记得赋予文件777权限
执行 sudo sh cuda_11.0.2_450.51.05_linux.run
vim /etc/profile
第一次发布
export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-%11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
第二次发布
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile
完成之后记得重启
输入nvcc -V
如果看到以下输出 则代表安装成功
在官网下载对应版本的cudnnNVIDIA cuDNN | NVIDIA Developer
将其通过FTP传送到服务器内 并进行解压
cudnn-11.0-linux-x64-v8.0.3.33.tgz
完成解压后将会得到一个CUDA文件夹
将里面的lib64与include复制到您之前安装CUDA的目录中去
之后输入
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
如看到以下输出 则代表安装成功
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。