默认情况下,用户在 TKE 添加 GPU 节点时,会自动预装特定版本 GPU 驱动,但是目前默认安装 GPU 驱动版本是固定的,用户还不能选择要安装的 GPU 驱动版本,当用户有其他版本的 GPU 驱动使用需求时,就需要在节点上重新安装,下面将介绍在 TKE 节点中如何重新安装 GPU 驱动程序。
先卸载原驱动,在节点上执行卸载命令:
nvidia-uninstall
原驱动卸载过程如下图所示:
提示卸载原驱动完成即表示成功卸载:
由于驱动是被编译进内核加载的,卸载完原驱动需要重启下节点,不重启会因原驱动还在加载中导致安装新驱动失败。
登录 NVIDIA 驱动下载 官网下载选择 linux 64 bit shell 安装文件,如下图:
这里我们选择安装 NVIDIA Tesla 10.2 版本驱动,最终可通过类似如下命令中的链接下载 shell 安装脚本到节点中并执行安装:
wget https://us.download.nvidia.com/tesla/440.95.01/NVIDIA-Linux-x86_64-440.95.01.run
chmod +x NVIDIA-Linux-x86_64-440.95.01.run
sh NVIDIA-Linux-x86_64-440.95.01.run
新驱动安装过程如下图:
等待新驱动安装完成:
nvidia-smi
查看 GPU 情况,可查看到 GPU 信息并显示驱动版本为新版本:kubectl describe node <NodeName>
从 k8s 节点资源查看 GPU 资源是否和实际资源一致,如下图:
本文简单介绍了如何在 TKE 重新安装 GPU 驱动程序,如有相关需求可按照上述操作安装。
参考资料:https://cloud.tencent.com/document/product/560/8048
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有