腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
OpenCL
中有
没有
像
cuda
的
时间
函数
一样
计算
内核
时间
的
方法
、
在
cuda
中,
内核
中有
一个名为time()
的
函数
,用于测试某些
函数
之间
的
延迟;例如,start_time = clock(); stop_time = clock();我找不到
OpenCL
有类似的功能,
在
OpenCL
中有
没有
什
浏览 25
提问于2020-05-28
得票数 1
5
回答
opencl
中
的
clock()
、
、
我知道
在
CUDA
中有
一个
函数
clock(),你可以放入
内核
代码并查询GPU
时间
。但是我想知道
在
OpenCL
中是否存在这样
的
东西?
在
OpenCL
中有
没有
查询GPU
时间
的
方法
?(我正在使用NVIDIA
的
工具包)。
浏览 0
提问于2012-01-13
得票数 5
回答已采纳
1
回答
CUDA
中有
内置
的
交叉积和点积吗?
在
CUDA
中有
没有
像
opencl
一样
内置
的
交叉积和点积,所以
cuda
内核
可以使用它?到目前为止,我还
没有
在说明书中找到任何东西。
浏览 1
提问于2010-07-08
得票数 7
回答已采纳
1
回答
空
内核
上
的
CUDA
与
OpenCL
性能
、
、
当在
CUDA
和
OpenCL
上测量同一个
内核
的
性能时,我发现了一件奇怪
的
事情。__attribute__((reqd_work_group_size(8, 8, 1))) __kernel
浏览 3
提问于2014-05-06
得票数 3
回答已采纳
1
回答
如何一步一步地调试
OpenCL
GPU应用程序
、
、
、
我想知道您是否知道如何使用
OpenCL
逐步调试
OpenCL
内核
(我
的
IDE是Visual ),并在NVidia GPU上运行
OpenCL
内核
。到目前为止我发现
的
是:
浏览 7
提问于2012-08-22
得票数 7
3
回答
图形处理器中
的
并行性-
CUDA
/
OpenCL
、
我对图形处理器上
的
CUDA
或
OpenCL
代码
的
并行性有一个一般性
的
问题。我使用
的
是NVIDIA GTX 470。 我
在
Cuda
编程指南中简短地阅读了一下,但
没有
找到相关
的
答案,因此在这里提问。我有一个顶级
函数
,它调用
CUDA
内核
(对于相同
的
内核
,我有它
的
OpenCL
版本)。对于3个不同
浏览 1
提问于2011-12-22
得票数 4
回答已采纳
1
回答
在
Nvidia下读取共享/本地内存存储/加载库冲突
的
OpenCL
可执行文件硬件计数器
、
、
、
、
但是,它不适用于使用
OpenCL
的
代码,而不是
CUDA
代码。有任何
方法
从ptx?Alternatively环境中提取nvprof之外
的
计数器吗?也许可以直接从
OpenCL
环境中提取PTX程序集,是否有
方法
将nvidia
OpenCL
编译器生成
的
PTX程序集使用带有CL_PROGRAM_BINARIES
的
clGetProgramInfo转换为
CUDA
内核
并使用cuModuleLoad
浏览 5
提问于2020-10-18
得票数 1
2
回答
OpenCL
和OpenGL
的
计算
着色器有什么不同?
、
、
、
我知道
OpenCL
可以控制图形处理器
的
内存架构,因此可以进行更好
的
优化,但是,抛开这一点不谈,我们可以使用
计算
着色器进行矢量操作(加法、乘法、反转等)吗?
浏览 1
提问于2013-04-08
得票数 61
回答已采纳
4
回答
用Delphi或FreePascal编写
CUDA
程序
、
、
我可以使用Delphi或FreePascal创建
CUDA
/
OpenCL
应用程序吗?出现了一些有希望
的
线索,但似乎
没有
一个工作,如果我想使用Pascal启动所有这些未使用
的
核心,我有什么选择?
浏览 0
提问于2011-05-07
得票数 6
回答已采纳
1
回答
显示
内核
错误
、
我正在使用GCC和NVIDIA实现
的
OpenCL
,和在线编译而不是离线编译。如果一个分号丢失了,或者我有一个野生指针,我想这样读,而不是只读一个-48错误。否则,开发
时间
变得太慢。我还添加了我
的
Makefile:FILE=main $(CC) -c -
浏览 0
提问于2013-08-14
得票数 0
回答已采纳
1
回答
如何在处理后读取显卡上
的
信息?
例如,假设我有一个10x10
的
“布料”网格,每个正方形是两个三角形。现在,如果我想做动画,我可以
在
CPU上做弹簧
计算
。每个顶点都有自己
的
“弹簧”数据,并且希望
像
它应该表示
的
任何类型
的
“布料”
一样
反弹。 然而,这将涉及到最低约380?每帧
的
弹簧
计算
。令人高兴
的
是,每个顶点
的
计算
是“令人尴尬
的
并行”-如果我每个顶点有一个CPU,每个顶点可以
在
浏览 1
提问于2011-09-09
得票数 0
回答已采纳
1
回答
在
没有
hwdownload
的
情况下将ffpmeg
OpenCL
过滤器输出传递给NVenc?
、
、
、
、
以下命令: ffmpeg -vsync 0 -hwaccel
cuda
-init_hw_device
opencl
=ocl -filter_hw_device ocl -threads 1当我只
在
没有
任何滤镜
的
情况下调整大小时,我
在
100%
的
GPU使用率下获得了大约400FPS。我怀疑最后
的
hwdownload,format=nv12,hwupload_
cuda
语句是一个问题,因为这会绕过主内存。我尝试只使用hwuploa
浏览 139
提问于2020-12-05
得票数 1
回答已采纳
1
回答
OpenGL中
的
动态着色器
CUDA
5和
OpenCL
2引入了动态并行性(由另一个
内核
通过设备API启动
的
内核
,而不是由主机API启动
的
内核
)。
在
OpenGL
中有
没有
类似的东西?有
没有
可能用反馈循环来模拟它们?(我不这么认为)他们不会错过OpenGL (可能在GL4.3
计算
着色器中)(阴影,纹理等)。
浏览 3
提问于2013-09-29
得票数 2
4
回答
测量
OpenCL
内核
的
执行
时间
、
我有以下循环来测量我
的
内核
的
时间
:cl_ulong time_start, time_end; elapsed += (time_end - time_start);然后我用elapsed除以NUMBER_OF_ITERATIONS得到最终
的
估计值然而,我担心单个
内核
的
执
浏览 2
提问于2014-05-09
得票数 11
2
回答
使用
CUDA
toolkit
OpenCL
sdk进行开发时,是否可以通过
OpenCL
瞄准CPU?
、
、
我是GPGPU概念
的
新手,在过去
的
几个月里,我一直
在
慢慢地学习
CUDA
和
OPENCL
之间
的
区别。我意识到
OpenCL
规范允许程序员以
计算
设备为目标(所以无论GPU/CPU体系结构如何),但
CUDA
方法
没有
这样
的
抽象,因为它总是以兼容
的
Nvidia GPU体系结构为目标。所以我想知道,如果我
在
CUDA
环境中使用Nvidi
浏览 2
提问于2010-11-14
得票数 3
回答已采纳
3
回答
gpu上
的
卷积:哪种语言(HLSL/
Cuda
等)
的
支持生命周期最长?
、
、
、
它目前有一个软件实现,但我认为GPU是未来
的
发展方向。我
的
算法是各种
内核
的
一系列卷积。然而,我
的
公司之前已经
在
Cpu上做了所有的事情(这是很多自动检查),所以我很难说服我
的
老板这是必要
的
,支持/寿命是其中很大
的
一部分。我们很可能会为这些东西提供10年
的
支持。那么哪种语言有最好
的
支持保证呢? Ps。我们在所有东西上都运行windows。
浏览 0
提问于2011-08-10
得票数 1
3
回答
OpenCL
还是
CUDA
该走哪条路?
、
、
、
我
的
标准如下: 我将在linux下用C和C++编写代码。
浏览 8
提问于2010-04-15
得票数 22
回答已采纳
2
回答
OpenMP可以扩展到包括图形处理器吗?
、
、
、
、
我读到了关于OpenMP和其他与并行处理相关的话题,发现其
中有
许多声称
CUDA
或
OpenCL
将是这类系统
的
未来。但是,我认为某些修改过
的
OpenMP版本将是最好
的
解决方案,我不认为GPU不应该运行线程
的
原因。我读到最近
的
OpenMP标准支持GPU,但是还
没有</e
浏览 8
提问于2015-04-17
得票数 3
回答已采纳
1
回答
如何在
OpenCL
中生成高斯分布随机数?
、
、
有
没有
其他
方法
可以得到高斯分布
的
随机数,或者现在有
没有
什么库可以这样做?我想在
OpenCL
中生成许多高斯分布
的
随机数,就像上面的url问题
一样
。它可以通过两个步骤做到这一点:然后,我可以使用将均匀随机变量转换为正态分布变量。这可能是
时间
昂贵
的
,所以有
没有
其他
方法
来获得高斯分布
的<
浏览 1
提问于2019-08-08
得票数 2
3
回答
基本GPU应用程序,整数
计算
、
、
在这里,我对我开发
的
典型应用程序框架做了一个非常粗略
的
概述,但考虑到它现在使用
的
是GPU (注意,我对GPU编程几乎
没有
实际知识)。仍然重要
的
是,数据类型和功能必须被精确地保留下来。下面是: 因此F(A,R,P)是一种自定义
函数
,例如元素替换、重复等。
函数
在
程序生存期内假定为常数,矩形
的
形状一般与A形不相等,因此不进行就地
计算
。因此,它们只是与我
的
功能一起产生
的
。F
的
浏览 8
提问于2015-05-20
得票数 17
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Julia编程中实现GPU加速
中国汽车行业,在未来的十年时间,有可能超过像博世一样的企业吗
详解英伟达芯片在自动驾驶的软件移植设计开发
全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍
OpenCL-0-基础概念
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券