相当于cudaDeviceSetCacheConfig的CUDA驱动程序接口

将CUDA (撰写本文时的最新版本，v11.3 )驱动程序API与运行时API进行比较，可以看出运行时API具有以下功能 __host__ cudaError_t cudaDeviceSetCacheConfig而且似乎驱动程序API没有等效的功能。你能理解为什么会这样吗?有没有办法用驱动程序API来设置设备范围的缓存配置？

浏览 2提问于2021-05-20得票数 0

回答已采纳

1回答

使用Nvidia平台为OpenCL配置本地(共享)内存

、、、

我想在我的OpenCL内核中优化本地内存访问模式。我在某个地方读过关于可配置本地内存的文章。例如，我们应该能够配置用于本地mem的金额和用于自动缓存的金额。我还读到，银行的规模可以选择最新的(开普勒) Nvidia硬件在这里：。对于将双精度值存储在本地内存中，这一点似乎是非常关键的。 Nvidia是否提供专门为CUDA用户设置本地内存的功能？

浏览 4提问于2014-09-16得票数 3

回答已采纳

1回答

nvidia driver、cuda driver和cuda toolkit之间有什么关系？

、

在nvidia驱动程序包中，有libcuda.so。cuda工具包和libcuda.so有什么关系？

浏览 24提问于2017-07-25得票数 17

回答已采纳

2回答

CUDA工作方式的一个限制是，我必须在初始化CUDA上下文的同一线程中访问它。但是，Twisted的线程池实现不允许我请求特定的线程。例如，如果我有多个客户端连接到服务器，它们将请求使用CUDA完成一些计算。将使用同一CUDA对象请求多个操作(初始化开销较大)。我想使用deferToThread函数，但这不允许我遵循特定的线程，只是“一些”线程。理想情况下，我想要做的是使用像deferToThread这样的<

浏览 0提问于2012-05-24得票数 2

回答已采纳

1回答

如何从OpenCL内核中获取全局变量的值给宿主C++程序？

、

在CUDA驱动程序接口中，有一个名为cuModuleGetGlobal的函数，它允许您按名称获取CUDA模块(已创建的CUDA程序的对象)中的全局变量的值。我想知道OpenCL是否也有同样的功能？

浏览 1提问于2012-07-26得票数 0

回答已采纳

1回答

在包含CUDA运行时API的主机代码中使用CUDA驱动程序API

如果我的程序已经包含Runtime API，是否可以使用CUDA驱动程序API？换句话说，可以同时使用驱动程序接口和运行时API吗?这是因为驱动程序接口为设备提供了良好的控制，但同时运行时APi也简化了编码！

浏览 0提问于2012-06-13得票数 1

2回答

AMD相当于CUDA驱动程序API？

、

CUDA具有运行时API和驱动API。在AMD中，什么等同于此？如果我以某种方式修改了llvm中的IL，我能得到更多的控制吗？

浏览 0提问于2011-08-18得票数 7

1回答

未定义的cudaMalloc符号

、

我正在尝试从CUDA 编译cublas示例。#include <stdio.h>#include <math.h> return EXIT_SUCCESS;我将这个文件保存到"cudaexample.c“中，并尝试使用gcc cudaexample.c -I/usr&

浏览 8提问于2015-02-27得票数 1

1回答

内核模式GPGPU的使用

、、、

可以从Linux内核模块运行CUDA或OpenCL应用程序吗？我找到了一个提供这个功能的项目，但是它需要一个用户空间助手来运行CUDA程序。()编辑：让我扩展我的问题。我知道内核组件只能调用内核和其他内核组件提供的API。因此，我不打算直接调用OpenCL或CUDA。最终，CUDA或OpenCL API必须调用图形驱动程序，才能实现它<e

浏览 2提问于2014-02-18得票数 3

回答已采纳

1回答

动态并行cudaDeviceSynchronize()崩溃

有人知道这种不文明行为的原因是什么吗？#include <cuda_runtime.h>#include "device_launch_parameters.h; // Set to use on chip memory 16KB for shared

浏览 0提问于2013-11-06得票数 0

4回答

如何在AWS p2.xlarge实例、AMI ami-edb11e8d和nvidia驱动程序中安装最新版本的Tensorflow (1.0)中的CUDA* 8.0 (375.39)*

、、、、

我已经升级到Tensorflow 1.0版，并安装了CUDA 8.0，cudnn 5.1版本和nvidia驱动程序更新到375.39。我的NVIDIA硬件是Amazon Web Services上使用p2.xlarge实例的硬件，也就是Tesla K-80。我的操作系统是64位的Linux。E tensorflow/stream_executor/cuda/cuda_driver.cc:509] failed call t

浏览 36提问于2017-02-24得票数 0

3回答

我可以在不传递指针数组的情况下启动协作内核吗？

、、、

CUDA运行时API允许我们使用变量数参数三元雪佛龙语法启动内核： first_argas_we, want_to, etc, etc); 为了启用网格同步，在启动内核时，必须使用cuLaunchCooperativeKernel CUDAcudaLaunchCooperativeKernel( const *func，dim3 gridDim，dim

浏览 1提问于2018-01-31得票数 4

回答已采纳

1回答

python中的Cuda* cuLaunchHostFunc等效*

、、、

使用Python驱动CUDA，我希望在内核和内存副本发生后运行的流中调度Python主机函数异步。在一个Python (PyCuda，Numba，.)中是否有与CUDA CUresult cuLaunchHostFunc(CUstream hStream, CUhostFn fn, void* userData)函数相同的函数？驱动程序API函数位于中。

浏览 4提问于2020-05-14得票数 0

回答已采纳

2回答

主机进程终止时的CUDA上下文销毁

、、、、

如果我的主机程序退出/segfault/被终止，那么关于CUDA上下文破坏和相应的已分配资源的相应行为是什么？我所说的“行为”是指如果我从未在我的程序中显式地调用cudaDeviceReset，那么自动的图形处理器驱动程序端机制。我在Linux下工作，我看到我的GPU内存使用量在几天(甚至一天)内递增地增长，而我正在启动CUDA代码，这些代码有时通过(CTRL-C)或简单地分段(在主机端)终止……

浏览 6提问于2013-10-04得票数 1

1回答

CUDA如何从屏幕上获取像素？

、、

我找到了这篇文章，但它展示了如何从文件夹中的图像中获取像素。有没有可能直接从桌面上获取像素？How to get image pixel value and image height and width in CUDA C?

浏览 29提问于2020-10-17得票数 0

1回答

CUDA内核printf()在终端中不产生输出，在分析器中工作

、

\n");} // namespace kernels { cuda::launch(::kernels::print_stuff<int>, launch_config);备注：我意识到理论上的<

浏览 7提问于2019-10-23得票数 1

回答已采纳

1回答

Cuda，为什么我不能使用多个流媒体处理器？

、、、

我在Cuda中实现了RNS Montgomery指数运算。但是，到目前为止，我只关注单个exp的并行化。我现在想做的是在飞行中测试几个exp。我试过了，最后的时间总是线性增长，也就是说，所有的exp都被分配到相同的SM。然而，我从来没有使用过它们，所以可能我做错了什么。threadsPerBlock(SET_SIZE, (SET_SIZE+1)/2);

浏览 6提问于2012-08-28得票数 0

回答已采纳

1回答

NVIDIA驱动程序-“工具包”选项是什么意思？

、、、

Not a duplicate of this question 在下载NVIDIA GPU驱动程序时，也有人问我更喜欢哪个CUDA工具包。现在，当下载一个驱动程序时，这个选择意味着什么？据我所知，不同的CUDA工具包有不同的最低驱动程序支持它们(在发行说明中也有说明)，但是在驱动程序下载页面上的这个选择意味着什么？

浏览 15提问于2019-09-09得票数 0

回答已采纳

1回答

从python代码向CUDA内核传递lambda的最佳方法

、、、

这将是一个更开放的问题，但我希望有人可能知道如何解决我的问题。如果你有任何建议，告诉我在哪里可以学到正确的方法，我将不胜感激！

浏览 0提问于2020-10-26得票数 0

1回答

是否可以在多个gpus上运行cuda内核

、、、

这是一个相当简单的问题，但谷歌搜索似乎没有答案，所以。如果是这样的话，为了实现它，我需要知道什么特别的东西吗?除了cuda sdk之外，还有什么值得了解的例子吗？

浏览 1提问于2010-12-03得票数 7

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Nvidia平台为OpenCL配置本地(共享)内存

nvidia driver、cuda driver和cuda toolkit之间有什么关系？

将Twisted中的代码推迟到特定线程

如何从OpenCL内核中获取全局变量的值给宿主C++程序？

在包含CUDA运行时API的主机代码中使用CUDA驱动程序API

AMD相当于CUDA驱动程序API？

未定义的cudaMalloc符号

内核模式GPGPU的使用

动态并行cudaDeviceSynchronize()崩溃

如何在AWS p2.xlarge实例、AMI ami-edb11e8d和nvidia驱动程序中安装最新版本的Tensorflow (1.0)中的CUDA* 8.0 (375.39)*

我可以在不传递指针数组的情况下启动协作内核吗？

python中的Cuda* cuLaunchHostFunc等效*

主机进程终止时的CUDA上下文销毁

CUDA如何从屏幕上获取像素？

CUDA内核printf()在终端中不产生输出，在分析器中工作

Cuda，为什么我不能使用多个流媒体处理器？

NVIDIA驱动程序-“工具包”选项是什么意思？

从python代码向CUDA内核传递lambda的最佳方法

是否可以在多个gpus上运行cuda内核

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐