Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【TKE】GPU 节点 NVIDIA Tesla 驱动重新安装

【TKE】GPU 节点 NVIDIA Tesla 驱动重新安装

原创
作者头像
Jokey
修改于 2021-06-01 15:11:30
修改于 2021-06-01 15:11:30
1.7K0
举报
文章被收录于专栏:云原生搬运工云原生搬运工

使用场景

默认情况下,用户在 TKE 添加 GPU 节点时,会自动预装特定版本 GPU 驱动,但是目前默认安装 GPU 驱动版本是固定的,用户还不能选择要安装的 GPU 驱动版本,当用户有其他版本的 GPU 驱动使用需求时,就需要在节点上重新安装,下面将介绍在 TKE 节点中如何重新安装 GPU 驱动程序。

操作步骤

1.卸载原驱动

先卸载原驱动,在节点上执行卸载命令:

代码语言:txt
AI代码解释
复制
nvidia-uninstall

原驱动卸载过程如下图所示:

没有使用相关配置,所以选择不备份
没有使用相关配置,所以选择不备份

提示卸载原驱动完成即表示成功卸载:

卸载完成
卸载完成

2.重启节点

由于驱动是被编译进内核加载的,卸载完原驱动需要重启下节点,不重启会因原驱动还在加载中导致安装新驱动失败。

3.下载新驱动程序并安装

登录 NVIDIA 驱动下载 官网下载选择 linux 64 bit shell 安装文件,如下图:

下载新驱动安装文件
下载新驱动安装文件

这里我们选择安装 NVIDIA Tesla 10.2 版本驱动,最终可通过类似如下命令中的链接下载 shell 安装脚本到节点中并执行安装:

代码语言:txt
AI代码解释
复制
wget https://us.download.nvidia.com/tesla/440.95.01/NVIDIA-Linux-x86_64-440.95.01.run
chmod +x NVIDIA-Linux-x86_64-440.95.01.run
sh NVIDIA-Linux-x86_64-440.95.01.run

新驱动安装过程如下图:

选择 YES
选择 YES

等待新驱动安装完成:

安装完成
安装完成

4.测试新驱动

  • 在节点上执行nvidia-smi查看 GPU 情况,可查看到 GPU 信息并显示驱动版本为新版本:
查看 GPU 信息
查看 GPU 信息
  • 查看 k8s 是否识别到节点 GPU 容量,执行命令:
代码语言:txt
AI代码解释
复制
kubectl describe node <NodeName>

从 k8s 节点资源查看 GPU 资源是否和实际资源一致,如下图:

k8s 节点资源
k8s 节点资源

总结

本文简单介绍了如何在 TKE 重新安装 GPU 驱动程序,如有相关需求可按照上述操作安装。

参考资料:https://cloud.tencent.com/document/product/560/8048

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Linux下GPU云服务器安装 NVIDIA Tesla 驱动
本篇介绍腾讯云环境GPU云服务器nvidia tesla驱动安装步骤。有很多腾讯云的使用者,在使用GPU服务器过程中,对驱动安装或者使用中有一些疑惑,比如系统kernel更新了,驱动失效了等问题。
tinkerli
2020/01/05
5.2K0
Linux下GPU云服务器安装 NVIDIA Tesla 驱动
腾讯云GPU云服务器配置初体验
GPU 云服务器(GPU Cloud Computing)是基于 GPU 的快速、稳定、弹性的计算服务,因此,可以广泛应用到深度学习训练/推理、图形图像处理以及科学计算等场景中。 GPU 云服务器提供和标准 CVM 云服务器一致的方便快捷的管理方式。GPU 云服务器通过其强大的快速处理海量数据的计算性能,有效解放用户的计算压力,提升业务处理效率与竞争力。腾讯云的GPU云服务器分为两类,一个是计算型实例服务器,一个是渲染型实例服务器。不管是何种类型的GPU云服务器,都需要配置和安装必要的组件才能正常工作和使用。
liuzhen007
2022/04/11
24.5K0
基于GPU实例的Nanopore数据预处理
纳米孔是一个纳米级的小孔,在其设备中,Oxford Nanopore 使离子电流通过纳米孔,并测量当生物分子通过或靠近纳米孔时的电流变化。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,而ATCG单个碱基的带电性质不一样,因此不同碱基通过蛋白纳米孔时对电流产生的干扰不同,通过实时监测并解码这些电流信号便可确定碱基序列,从而实现测序。
4BasesTeam
2022/04/23
2.8K1
基于GPU实例的Nanopore数据预处理
在GPU计算型实例中安装Tesla驱动超详细过程
摘要:在深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景下,安装了Tesla驱动的GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。如果您在创建GPU计算型实例(Linux)时未同时安装Tesla驱动,则需要在创建GPU实例后,单独安装Tesla驱动(Linux)。每次按照Tesla驱动的时候,上面都是英文,不太懂意思,本文为您介绍详细过程,希望对大家有帮助。
正在走向自律
2024/12/18
4030
在GPU计算型实例中安装Tesla驱动超详细过程
安装 nvidia 显卡驱动及故障排查
在一台旧一点的服务器 (CentOS 8.5.2111) 上安装 NVIDIA 显卡驱动及 CUDA 工具包。
叶子Tenney
2024/10/25
7880
安装 nvidia 显卡驱动及故障排查
Tlinux/CentOS7安装NVIDIA显卡驱动和CUDA10.1 cuDNN
此篇博客记录一下TLinux系统安装显卡NVIDIA驱动与CUDA10/11的艰难过程。
大鹅
2021/06/16
2K0
腾讯云GPU服务器初体验:从零搭建Pytorch GPU开发环境
点击【立即选购】可以进入选购页面。每种机型又对应不同的规格。基本上同机型(比如GN7)他们的显卡型号都是相同的,该机型下的不同规格(比如GN7.LARGE20、GN7.2XLARGE32)只是在CPU、内存、带宽以及显卡个数方面不同而已。下面简单列一下机型与显卡的对应关系(截至2022年5月):
果冻虾仁
2022/05/06
9.9K0
腾讯云GPU服务器初体验:从零搭建Pytorch GPU开发环境
Ubuntu sever20.04 LTS版本GPU服务器深度学习环境配置
在非图形界面的Ubuntu server20.04的GPU服务器上配置环境,包括Nvidia驱动,cuda,cuDNN的安装,Anaconda的安装和开发环境创建。最好的参考文档是各软件的官方文档。
GIS指北
2022/11/14
2.8K0
Ubuntu sever20.04 LTS版本GPU服务器深度学习环境配置
Ubuntu 14.04 16.04 Linux nvidia 驱动下载与安装
但是有时候,驱动不够新,比如14.04用的是340.98版本,如果手动安装驱动可以参考官网指南。
zhangrelay
2019/01/23
4.5K0
Linux安装NVIDIA显卡驱动的正确姿势
可能想玩Linux系统的童鞋,往往死在安装NVIDIA显卡驱动上,所以这篇文章帮助大家以正常的方式安装NVIDIA驱动。
全栈程序员站长
2022/07/23
16.7K0
Linux安装NVIDIA显卡驱动的正确姿势
KubeSphere 最佳实战:openEuler 22.03 LTS SP3 安装 NVIDIA 显卡驱动
今天分享的内容是 KubeSphere 最佳实战「2024」 系列文档中的 openEuler 22.03 LTS SP3 安装 NVIDIA 显卡驱动。
运维有术
2024/05/23
6720
KubeSphere 最佳实战:openEuler 22.03 LTS SP3 安装 NVIDIA 显卡驱动
.deb版本cuda安装。
1).run形式安装cuda。清理原有显卡驱动后,先安装自己显卡对应的驱动,在步骤中出现”Would you like to run the nvidia-xconfig utility to automatically update your X configuration file…”时,选择 No。(这里是cuda自带的旧版本的驱动)。
全栈程序员站长
2022/09/05
2.9K0
如何在CDSW中使用GPU运行深度学习
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 Fayson的github: https://github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢 GPU是一种专门的处理器,对于加速高度并行化的计算密集型工作负载效果非常明显,尤其是在深度学习领域。理想的情况是你将GPU和CPU结合起来用于数据工程和数据科学的工作负载。典型的机器学习工作流程涉及数据准备、模型训练、模型评分和模型拟合。你可以在工作流程的每个阶段使用现有的通用CPU,并可选择性的使用专用G
Fayson
2018/07/12
1.9K0
nvidia quadro m5000 驱动安装 - 1804 ubuntu; nvidia-smi topo --matrix 查看gpu拓扑;nvidia-smi命令使用;
查看GPU型号: lspci | grep -i nvidia 驱动安装: https://www.nvidia.cn/Download/index.aspx?lang=cn  下载对应版本的驱动驱动
西湖醋鱼
2020/12/30
2.8K0
nvidia quadro m5000 驱动安装 - 1804 ubuntu; nvidia-smi topo --matrix 查看gpu拓扑;nvidia-smi命令使用;
腾讯云GPU云服务器深度学习初体验
最近在跑深度学习,需要大量的算力资源,偶然机会注意到了腾讯云的GPU云服务器的体验活动,果断参加,现将我个人的快速上手体验和遇到的问题分享给大家,请大家指正。
不会炼丹的程序员
2022/05/30
33K2
Ubuntu18.04下安装Pytorch-GPU(超详细自己安装全过程)「建议收藏」
硬件环境: 自己的笔记本电脑 CPU:i5-4210M GPU:NVIDIA Geforce 940M
全栈程序员站长
2022/11/10
3K0
Ubuntu18.04下安装Pytorch-GPU(超详细自己安装全过程)「建议收藏」
在GPU服务器中搭建深度学习应用后端——以YOLOv5为例
测试时将带有图片的POST请求发送至ip:5000/v1/object-detection/yolov5s
深度学习小胡
2022/04/14
5.4K0
CUDA常见驱动程序兼容性问题一览
驱动程序的兼容性对于CUDA的正常运行至关重要。在Linux系统中,驱动程序的安装与配置常常面临各种问题。本文将详细列举驱动程序兼容性问题及其解决方案,确保能够顺利配置和使用CUDA环境。
TechLead
2024/08/01
2370
CUDA常见驱动程序兼容性问题一览
DeepSeek-进阶版部署(Linux+GPU)
前面几个小节讲解的Win和Linux部署DeepSeek的比较简单的方法,而且采用的模型也是最小的,作为测试体验使用是没问题的。如果要在生产环境使用还是需要用到GPU来实现,下面我将以有一台带上GPU显卡的Linux机器来部署DeepSeek。这里还只是先体验单机单卡,后期会更新多机多卡使用更高模型的文章。
运维小路
2025/02/26
5800
DeepSeek-进阶版部署(Linux+GPU)
容器化 TensorFlow GPU 环境搭建
CPU:Intel Xeon E5-2699 v4 显卡:Nvidia Tesla P100 操作系统:CentOS 7.4
轻量级云原生架构实验室
2018/12/19
1.1K0
推荐阅读
相关推荐
Linux下GPU云服务器安装 NVIDIA Tesla 驱动
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档