腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CUDA优化网格步长环块数
、
、
、
我已经开始使用CUDA实现一个简单的一维数组计算。在文档之后,我首先尝试定义最佳块数和块大小。int N_array = 1000000int n_threads = 256; dim3 grid(n_blocks, 1, 1);......in
浏览 2
提问于2022-07-11
得票数 0
回答已采纳
2
回答
如何确定是否正在使用
GPU
卡?
在CUDA中,是否有运行时API可以判断
GPU
设备是否正在使用?用户是来自视频显示还是GUGPU应用程序?什么是
GPU
占用率
?
浏览 10
提问于2012-12-18
得票数 3
回答已采纳
1
回答
torch.cuda.is_available()返回true,但火炬模型仍在CPU上训练
、
、
我尝试创建一个新环境,如下所示: 我检查了cuda运行良好,我的
gpu
被检测到,一切似乎都很好。但当我拟合模型时,nvdia-smi在
GPU
上的
占用率
为100%。
浏览 0
提问于2021-03-25
得票数 1
1
回答
用于Maxwell体系结构和计算能力5的CUDA
占用率
表
我正在尝试使用cuda
占用率
计算器,用于Maxwell
GPU
,它可以满足5的计算能力。不幸的是,select计算能力选项中的
占用率
表允许使用到3.5。
浏览 2
提问于2015-07-03
得票数 0
回答已采纳
1
回答
在代码中共享
GPU
资源
、
、
我使用在
GPU
上运行的OpenCL实现了这个计算。从那时起,我观察到OpenGL绘图的视觉延迟太大。更新.因此,
GPU
现在占用较少,但内核工作时间更长。因此,OpenGL变得更慢。因此,看起来OpenGL绘图和OpenCL计算不能同时进行。在
浏览 5
提问于2012-02-08
得票数 1
1
回答
CUDA编程:占用是在不同进程之间实现
GPU
切片的方法吗?
、
、
、
、
可以通过多种方式实现
GPU
共享。我遇到了入住率。我可以使用它在共享
GPU
的进程(例如tensorflow)之间对
GPU
进行切片吗?这里的切片意味着
GPU
资源始终专用于该进程。使用
占用率
,我将获得
GPU
和SMs的详细信息,并在此基础上启动内核,声明为这些
GPU
资源创建块。
浏览 0
提问于2018-08-08
得票数 1
1
回答
batch_size在深度学习模型拟合中的二次幂
、
、
我目前正在阅读Keras的作者Francois的“用Python进行深度学习”,在他对小型批处理的一个定义中,他解释说,batch_size的2功能是由于
gpu
中的内存分配/有人能详细说明这一点吗?样本数通常是2的幂,以便于
GPU
上的内存分配。在训练时,使用一个小批处理来计算应用于模型权重的单个梯度下降更新。
浏览 0
提问于2018-12-23
得票数 1
1
回答
有没有办法通过编程的方式知道我们的CUDA代码在哪个
GPU
上运行?
、
我想知道我的CUDA内核将在哪个
GPU
上运行,这样我就可以通过编程来决定要使用的最佳块大小,以便最大化任何算法的
GPU
实现的性能。
浏览 0
提问于2018-10-28
得票数 2
3
回答
计算着色器的最佳工作组数
在OpenGL中,是否有一种动态确定底层硬件的首选工作组大小的方法?或者至少,使用一些被查询的度量来近似它? 在OpenCL,您可以使用一些实现定义的常量来完成这一任务。中,但是到目前为止,我还没有找到类似于OpenGL的东西。
浏览 0
提问于2013-11-22
得票数 5
回答已采纳
1
回答
没有并行运行的CUDA流
、
、
鉴于这一守则: cudaStreamSynchronize(streams[image]); }
查看
请注意,我的内核使用了30个寄存器,并且它们都报告了大约0.87的“已实现
占用率
”。对于最小的图像,网格大小为1
浏览 4
提问于2016-01-18
得票数 1
回答已采纳
1
回答
管理数据自动化系统的占用情况
、
、
、
、
的网站上看到,要想有好的表现,我们应该考虑以下四点: 因此,我要回顾一下第一件事情,根据
GPU
例如,对于NVidia 1080
GPU
,我读到: int max_blocks = 32; //maximum number of active blocks per SM int max_threads_per_Block= 64; //maximum number of activ
浏览 0
提问于2016-10-17
得票数 1
2
回答
Nvidia的Fermi
GPU
如何向流媒体多处理器发布线程块
、
、
假设我有8个线程块,我的
GPU
有8个SMs。那么
GPU
是如何向SMs发出这个线程块的呢?我想知道哪一个才是现实。提前谢谢。
浏览 5
提问于2013-02-01
得票数 3
1
回答
在CUDA中使用cos和sin的内核在每块使用更多476个线程时失败
、
、
在CUDA计算能力2.0中,我遇到了sin和cos的问题。当为CUDA计算能力1.x编译代码时,不会出现这种情况。我做了一个简单的代码。我在GeForce GTX 550 Ti和GeForce GTX 480上进行了测试,结果都是一样的。这是代码:#include <stdio.h>#include "cuda_runtime.h"#ifd
浏览 6
提问于2013-09-10
得票数 0
回答已采纳
1
回答
当现代
gpu
内存耗尽时,如何利用磁盘上的交换空间?
、
、
、
后Pascal 可以分配比
GPU
内存更多的内存,这将自动在
GPU
内存和主机内存之间交换。 malloc(1<<20);
浏览 4
提问于2022-10-29
得票数 1
回答已采纳
2
回答
OpenCV图形处理器
占用率
检测
、
、
、
我正在尝试使用
GPU
hog探测器。我的猪有Size(4,4)大小的细胞。然而,在opencv/modules/
gpu
/src/cuda/hog.cu中,它声明 #define CELL_WIDTH 8#define CELL_HEIGHT 8 或者,在opencv/modules/
gpu
浏览 1
提问于2012-10-29
得票数 2
1
回答
Nividia计算视觉探查器选项灰白
当
占用率
分析被激活时。 这种行为是由于我的旧
gpu
(Quadro FX 580与CC 1.1)。还是因为我设置了错误的复选框?
浏览 2
提问于2011-08-08
得票数 0
回答已采纳
1
回答
服务器重启内存被大量占用?
浏览 407
提问于2019-11-03
2
回答
关于寄存器的CUDA内核的优化
、
我正在使用CUDA
占用率
计算器来优化我的CUDA内核。目前我使用了34个寄存器和零个共享memory...Thus,每块310个线程的最大
占用率
为63%。当我以某种方式将寄存器(例如,通过共享内存传递内核参数)更改为20或更低时,我可以获得100%的
占用率
。这是一个好方法吗?或者你会建议我使用另一种优化方法吗?
浏览 1
提问于2011-05-19
得票数 4
回答已采纳
1
回答
为什么不能使用
gpu
来降低cpu
占用率
?
、
、
、
但是这里有另一种情况,
gpu
和cpu函数必须串行执行,问题是当cpu被
gpu
内核执行阻塞时,cpu进程会暂停吗?如果是,cpu的
占用率
应该很低,对吧?data, d_data, sizeof(int), cudaMemcpyDeviceToHost); return 0;使用top检查cpu
占用率
是否为
浏览 0
提问于2015-07-01
得票数 1
2
回答
CUDA :具有公共(共享)参数的内核并发性
此外,V1与v0相比,无论是存储效率(存储: 90%,负载: 155%)还是
占用率
(达到52%,理论: 62%)都有很大的提高。根据汤姆的回答,我不知道“如何检查
GPU
是否已满”。v2的内核占据了30%的空间:对我来说,这意味着已经有其他内核的空间了,不是吗?!我刚刚尝试过更小的块/网格大小,但这似乎没有帮助(更糟糕的是:
占用率
下降到10%)。我觉得我错过了什么东西,堵塞了
GPU
,但是,我不知道这是什么。我已经尝试过调整网格的大小,并使用CUDA
占用率
计算器电子表格进行阻塞。结果表明,对
浏览 2
提问于2015-06-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux查看日志
Linux下查看CPU信息
Linux 查看 SELinux 的状态
linux 基本日志查看命令
Linux查看文件类型命令实验
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券