linux 查看gpu占用率 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

CUDA优化网格步长环块数

、、、

我已经开始使用CUDA实现一个简单的一维数组计算。在文档之后，我首先尝试定义最佳块数和块大小。int N_array = 1000000int n_threads = 256; dim3 grid(n_blocks, 1, 1);......in

浏览 2提问于2022-07-11得票数 0

回答已采纳

2回答

如何确定是否正在使用GPU卡？

在CUDA中，是否有运行时API可以判断GPU设备是否正在使用？用户是来自视频显示还是GUGPU应用程序？什么是GPU占用率？

浏览 10提问于2012-12-18得票数 3

回答已采纳

1回答

torch.cuda.is_available()返回true，但火炬模型仍在CPU上训练

、、

我尝试创建一个新环境，如下所示：我检查了cuda运行良好，我的gpu被检测到，一切似乎都很好。但当我拟合模型时，nvdia-smi在GPU上的占用率为100%。

浏览 0提问于2021-03-25得票数 1

1回答

用于Maxwell体系结构和计算能力5的CUDA占用率表

我正在尝试使用cuda占用率计算器，用于Maxwell GPU，它可以满足5的计算能力。不幸的是，select计算能力选项中的占用率表允许使用到3.5。

浏览 2提问于2015-07-03得票数 0

回答已采纳

1回答

在代码中共享GPU资源

、、

我使用在GPU上运行的OpenCL实现了这个计算。从那时起，我观察到OpenGL绘图的视觉延迟太大。更新.因此，GPU现在占用较少，但内核工作时间更长。因此，OpenGL变得更慢。因此，看起来OpenGL绘图和OpenCL计算不能同时进行。在

浏览 5提问于2012-02-08得票数 1

1回答

CUDA编程:占用是在不同进程之间实现GPU切片的方法吗？

、、、、

可以通过多种方式实现GPU共享。我遇到了入住率。我可以使用它在共享GPU的进程(例如tensorflow)之间对GPU进行切片吗？这里的切片意味着GPU资源始终专用于该进程。使用占用率，我将获得GPU和SMs的详细信息，并在此基础上启动内核，声明为这些GPU资源创建块。

浏览 0提问于2018-08-08得票数 1

1回答

batch_size在深度学习模型拟合中的二次幂

、、

我目前正在阅读Keras的作者Francois的“用Python进行深度学习”，在他对小型批处理的一个定义中，他解释说，batch_size的2功能是由于gpu中的内存分配/有人能详细说明这一点吗？样本数通常是2的幂，以便于GPU上的内存分配。在训练时，使用一个小批处理来计算应用于模型权重的单个梯度下降更新。

浏览 0提问于2018-12-23得票数 1

1回答

有没有办法通过编程的方式知道我们的CUDA代码在哪个GPU上运行？

、

我想知道我的CUDA内核将在哪个GPU上运行，这样我就可以通过编程来决定要使用的最佳块大小，以便最大化任何算法的GPU实现的性能。

浏览 0提问于2018-10-28得票数 2

1回答

没有并行运行的CUDA流

、、

鉴于这一守则： cudaStreamSynchronize(streams[image]); }查看请注意，我的内核使用了30个寄存器，并且它们都报告了大约0.87的“已实现占用率”。对于最小的图像，网格大小为1

浏览 4提问于2016-01-18得票数 1

回答已采纳

1回答

管理数据自动化系统的占用情况

、、、、

的网站上看到，要想有好的表现，我们应该考虑以下四点：因此，我要回顾一下第一件事情，根据GPU例如，对于NVidia 1080 GPU，我读到： int max_blocks = 32; //maximum number of active blocks per SM int max_threads_per_Block= 64; //maximum number of activ

浏览 0提问于2016-10-17得票数 1

2回答

Nvidia的Fermi GPU如何向流媒体多处理器发布线程块

、、

假设我有8个线程块，我的GPU有8个SMs。那么GPU是如何向SMs发出这个线程块的呢？我想知道哪一个才是现实。提前谢谢。

浏览 5提问于2013-02-01得票数 3

1回答

在CUDA中使用cos和sin的内核在每块使用更多476个线程时失败

、、

在CUDA计算能力2.0中，我遇到了sin和cos的问题。当为CUDA计算能力1.x编译代码时，不会出现这种情况。我做了一个简单的代码。我在GeForce GTX 550 Ti和GeForce GTX 480上进行了测试，结果都是一样的。这是代码：#include <stdio.h>#include "cuda_runtime.h"#ifd

浏览 6提问于2013-09-10得票数 0

回答已采纳

1回答

当现代gpu内存耗尽时，如何利用磁盘上的交换空间？

、、、

后Pascal 可以分配比GPU内存更多的内存，这将自动在GPU内存和主机内存之间交换。 malloc(1<<20);

浏览 4提问于2022-10-29得票数 1

回答已采纳

2回答

OpenCV图形处理器占用率检测

、、、

我正在尝试使用GPU hog探测器。我的猪有Size(4,4)大小的细胞。然而，在opencv/modules/gpu/src/cuda/hog.cu中，它声明 #define CELL_WIDTH 8#define CELL_HEIGHT 8 或者，在opencv/modules/gpu

浏览 1提问于2012-10-29得票数 2

1回答

Nividia计算视觉探查器选项灰白

当占用率分析被激活时。这种行为是由于我的旧gpu (Quadro FX 580与CC 1.1)。还是因为我设置了错误的复选框？

浏览 2提问于2011-08-08得票数 0

回答已采纳

1回答

关于寄存器的CUDA内核的优化

、

我正在使用CUDA占用率计算器来优化我的CUDA内核。目前我使用了34个寄存器和零个共享memory...Thus，每块310个线程的最大占用率为63%。当我以某种方式将寄存器(例如，通过共享内存传递内核参数)更改为20或更低时，我可以获得100%的占用率。这是一个好方法吗?或者你会建议我使用另一种优化方法吗？

浏览 1提问于2011-05-19得票数 4

回答已采纳

1回答

为什么不能使用gpu来降低cpu占用率？

、、、

但是这里有另一种情况，gpu和cpu函数必须串行执行，问题是当cpu被gpu内核执行阻塞时，cpu进程会暂停吗？如果是，cpu的占用率应该很低，对吧？data, d_data, sizeof(int), cudaMemcpyDeviceToHost); return 0;使用top检查cpu占用率是否为

浏览 0提问于2015-07-01得票数 1

2回答

此外，V1与v0相比，无论是存储效率(存储: 90%，负载: 155%)还是占用率(达到52%，理论: 62%)都有很大的提高。根据汤姆的回答，我不知道“如何检查GPU是否已满”。v2的内核占据了30%的空间:对我来说，这意味着已经有其他内核的空间了，不是吗?！我刚刚尝试过更小的块/网格大小，但这似乎没有帮助(更糟糕的是:占用率下降到10%)。我觉得我错过了什么东西，堵塞了GPU，但是，我不知道这是什么。我已经尝试过调整网格的大小，并使用CUDA占用率计算器电子表格进行阻塞。结果表明，对

浏览 2提问于2015-06-08得票数 0

点击加载更多