在OpenCL中有没有像cuda的时间函数一样计算内核时间的方法

、

在cuda中，内核中有一个名为time()的函数，用于测试某些函数之间的延迟；例如，start_time = clock(); stop_time = clock();我找不到OpenCL有类似的功能，在OpenCL中有没有什

浏览 25提问于2020-05-28得票数 1

5回答

opencl中的clock()

、、

我知道在CUDA中有一个函数clock()，你可以放入内核代码并查询GPU时间。但是我想知道在OpenCL中是否存在这样的东西？在OpenCL中有没有查询GPU时间的方法？(我正在使用NVIDIA的工具包)。

浏览 0提问于2012-01-13得票数 5

回答已采纳

1回答

CUDA中有内置的交叉积和点积吗？

在CUDA中有没有像opencl一样内置的交叉积和点积，所以cuda内核可以使用它？到目前为止，我还没有在说明书中找到任何东西。

浏览 1提问于2010-07-08得票数 7

回答已采纳

1回答

空内核上的CUDA与OpenCL性能

、、

当在CUDA和OpenCL上测量同一个内核的性能时，我发现了一件奇怪的事情。__attribute__((reqd_work_group_size(8, 8, 1))) __kernel

浏览 3提问于2014-05-06得票数 3

回答已采纳

1回答

如何一步一步地调试OpenCL GPU应用程序

、、、

我想知道您是否知道如何使用OpenCL逐步调试OpenCL内核(我的IDE是Visual )，并在NVidia GPU上运行OpenCL内核。到目前为止我发现的是：

浏览 7提问于2012-08-22得票数 7

3回答

图形处理器中的并行性- CUDA / OpenCL

、

我对图形处理器上的CUDA或OpenCL代码的并行性有一个一般性的问题。我使用的是NVIDIA GTX 470。我在Cuda编程指南中简短地阅读了一下，但没有找到相关的答案，因此在这里提问。我有一个顶级函数，它调用CUDA内核(对于相同的内核，我有它的OpenCL版本)。对于3个不同

浏览 1提问于2011-12-22得票数 4

回答已采纳

1回答

在Nvidia下读取共享/本地内存存储/加载库冲突的OpenCL可执行文件硬件计数器

、、、、

但是，它不适用于使用OpenCL的代码，而不是CUDA代码。有任何方法从ptx?Alternatively环境中提取nvprof之外的计数器吗?也许可以直接从OpenCL环境中提取PTX程序集，是否有方法将nvidia OpenCL编译器生成的PTX程序集使用带有CL_PROGRAM_BINARIES的clGetProgramInfo转换为CUDA内核并使用cuModuleLoad

浏览 5提问于2020-10-18得票数 1

2回答

OpenCL和OpenGL的计算着色器有什么不同？

、、、

我知道OpenCL可以控制图形处理器的内存架构，因此可以进行更好的优化，但是，抛开这一点不谈，我们可以使用计算着色器进行矢量操作(加法、乘法、反转等)吗？

浏览 1提问于2013-04-08得票数 61

回答已采纳

4回答

用Delphi或FreePascal编写CUDA程序

、、

我可以使用Delphi或FreePascal创建CUDA/OpenCL应用程序吗？出现了一些有希望的线索，但似乎没有一个工作，如果我想使用Pascal启动所有这些未使用的核心，我有什么选择？

浏览 0提问于2011-05-07得票数 6

回答已采纳

1回答

显示内核错误

、

我正在使用GCC和NVIDIA实现的OpenCL，和在线编译而不是离线编译。如果一个分号丢失了，或者我有一个野生指针，我想这样读，而不是只读一个-48错误。否则，开发时间变得太慢。我还添加了我的Makefile：FILE=main $(CC) -c -

浏览 0提问于2013-08-14得票数 0

回答已采纳

1回答

如何在处理后读取显卡上的信息？

例如，假设我有一个10x10的“布料”网格，每个正方形是两个三角形。现在，如果我想做动画，我可以在CPU上做弹簧计算。每个顶点都有自己的“弹簧”数据，并且希望像它应该表示的任何类型的“布料”一样反弹。然而，这将涉及到最低约380？每帧的弹簧计算。令人高兴的是，每个顶点的计算是“令人尴尬的并行”-如果我每个顶点有一个CPU，每个顶点可以在

浏览 1提问于2011-09-09得票数 0

回答已采纳

1回答

在没有hwdownload的情况下将ffpmeg OpenCL过滤器输出传递给NVenc？

、、、、

以下命令： ffmpeg -vsync 0 -hwaccel cuda -init_hw_device opencl=ocl -filter_hw_device ocl -threads 1当我只在没有任何滤镜的情况下调整大小时，我在100%的GPU使用率下获得了大约400FPS。我怀疑最后的hwdownload,format=nv12,hwupload_cuda语句是一个问题，因为这会绕过主内存。我尝试只使用hwuploa

浏览 139提问于2020-12-05得票数 1

回答已采纳

1回答

OpenGL中的动态着色器

CUDA 5和OpenCL 2引入了动态并行性(由另一个内核通过设备API启动的内核，而不是由主机API启动的内核)。在OpenGL中有没有类似的东西？有没有可能用反馈循环来模拟它们？(我不这么认为)他们不会错过OpenGL (可能在GL4.3计算着色器中)(阴影，纹理等)。

浏览 3提问于2013-09-29得票数 2

4回答

测量OpenCL内核的执行时间

、

我有以下循环来测量我的内核的时间：cl_ulong time_start, time_end; elapsed += (time_end - time_start);然后我用elapsed除以NUMBER_OF_ITERATIONS得到最终的估计值然而，我担心单个内核的执

浏览 2提问于2014-05-09得票数 11

2回答

使用CUDA* toolkit OpenCL sdk进行开发时，是否可以通过OpenCL瞄准CPU？*

、、

我是GPGPU概念的新手，在过去的几个月里，我一直在慢慢地学习CUDA和OPENCL之间的区别。我意识到OpenCL规范允许程序员以计算设备为目标(所以无论GPU/CPU体系结构如何)，但CUDA方法没有这样的抽象，因为它总是以兼容的Nvidia GPU体系结构为目标。所以我想知道，如果我在CUDA环境中使用Nvidi

浏览 2提问于2010-11-14得票数 3

回答已采纳

3回答

gpu上的卷积:哪种语言(HLSL/Cuda等)的支持生命周期最长？

、、、

它目前有一个软件实现，但我认为GPU是未来的发展方向。我的算法是各种内核的一系列卷积。然而，我的公司之前已经在Cpu上做了所有的事情(这是很多自动检查)，所以我很难说服我的老板这是必要的，支持/寿命是其中很大的一部分。我们很可能会为这些东西提供10年的支持。那么哪种语言有最好的支持保证呢？ Ps。我们在所有东西上都运行windows。

浏览 0提问于2011-08-10得票数 1

3回答

OpenCL还是CUDA该走哪条路？

、、、

我的标准如下：我将在linux下用C和C++编写代码。

浏览 8提问于2010-04-15得票数 22

回答已采纳

2回答

OpenMP可以扩展到包括图形处理器吗？

、、、、

我读到了关于OpenMP和其他与并行处理相关的话题，发现其中有许多声称CUDA或OpenCL将是这类系统的未来。但是，我认为某些修改过的OpenMP版本将是最好的解决方案，我不认为GPU不应该运行线程的原因。我读到最近的OpenMP标准支持GPU，但是还没有</e

浏览 8提问于2015-04-17得票数 3

回答已采纳

1回答

如何在OpenCL中生成高斯分布随机数？

、、

有没有其他方法可以得到高斯分布的随机数，或者现在有没有什么库可以这样做？我想在OpenCL中生成许多高斯分布的随机数，就像上面的url问题一样。它可以通过两个步骤做到这一点：然后，我可以使用将均匀随机变量转换为正态分布变量。这可能是时间昂贵的，所以有没有其他方法来获得高斯分布的<

浏览 1提问于2019-08-08得票数 2

3回答

基本GPU应用程序，整数计算

、、

在这里，我对我开发的典型应用程序框架做了一个非常粗略的概述，但考虑到它现在使用的是GPU (注意，我对GPU编程几乎没有实际知识)。仍然重要的是，数据类型和功能必须被精确地保留下来。下面是：因此F(A，R，P)是一种自定义函数，例如元素替换、重复等。函数在程序生存期内假定为常数，矩形的形状一般与A形不相等，因此不进行就地计算。因此，它们只是与我的功能一起产生的。F的

浏览 8提问于2015-05-20得票数 17

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

opencl中的clock()

CUDA中有内置的交叉积和点积吗？

空内核上的CUDA与OpenCL性能

如何一步一步地调试OpenCL GPU应用程序

图形处理器中的并行性- CUDA / OpenCL

在Nvidia下读取共享/本地内存存储/加载库冲突的OpenCL可执行文件硬件计数器

OpenCL和OpenGL的计算着色器有什么不同？

用Delphi或FreePascal编写CUDA程序

显示内核错误

如何在处理后读取显卡上的信息？

在没有hwdownload的情况下将ffpmeg OpenCL过滤器输出传递给NVenc？

OpenGL中的动态着色器

测量OpenCL内核的执行时间

使用CUDA* toolkit OpenCL sdk进行开发时，是否可以通过OpenCL瞄准CPU？*

gpu上的卷积:哪种语言(HLSL/Cuda等)的支持生命周期最长？

OpenCL还是CUDA该走哪条路？

OpenMP可以扩展到包括图形处理器吗？

如何在OpenCL中生成高斯分布随机数？

基本GPU应用程序，整数计算

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐