前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >推荐一个更好的nvidia-smi,用于多人集群按照用户名查看GPU使用情况

推荐一个更好的nvidia-smi,用于多人集群按照用户名查看GPU使用情况

原创
作者头像
阮小七
修改2022-12-14 06:40:38
3.1K0
修改2022-12-14 06:40:38
举报
文章被收录于专栏:愚公移山

无论是个人使用GPU, 还是多人使用GPU集群,都会面临查看进程占用GPU情况,以合理调配GPU使用。

一种办法是用nvidia-smi,如图

image.png
image.png

用ps -aux命令找到想要关闭进程的对应PID,然后根据PID关闭进程(kill -9 PID)。实际上ps -aux会出一大堆(太长不展示了。。)后台近乎不占据任何资源的进程, 所以找起来真的很费劲。

因而, 这里推荐一个工具nvidia-htop,链接在https://github.com/peci1/nvidia-htop

pip安装后, 使用 nvidia-htop.py -l 查看当前集群内GPU占用情况, 有nvidia-smi自带的信息,同时还带有更详细的比如进程所属用户名称,所调用的命令,如图

image.png
image.png

这样就可以准确清晰找到目标进程的信息, 进行管理。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档