腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
cudaFree
()
之前
是否
需要
cudaDeviceSynchronize
()?
、
>>>(ptr);
cudaDeviceSynchronize
(); // Is this required?
cudaFree
(ptr); 答案会因cudaMallocManaged()而改变吗
浏览 68
提问于2019-09-24
得票数 1
回答已采纳
1
回答
在
CUDA设备上初始化嵌套数组
、
all[1].values[0] = 0.4; print_device<<<1, 1>>>(all); cudaCheckErrors(
cudaFree
(all[1].values)); cudaCheckErrors(
cudaFree
(all));我不介意该解决方案
是否
使用统一(托管)内存。
浏览 32
提问于2019-10-23
得票数 0
回答已采纳
1
回答
cudaErrorUnknown函数调用中的“cudaMemcpy”
、
、
、
for (int i=0; i<blocksPerGrid; i++) { } checkCudaErrors(
cudaFree
(dev_partial_c)); // Reset the deviceand exit return sum;
浏览 9
提问于2013-10-04
得票数 1
回答已采纳
2
回答
在
CUDA中防止内核调用后的析构函数调用
、
class A { float* dataOnGPU; ~A() {
cudaFree
( dataOnGPU
在
obj超出范围
之前
,obj.dataOnGPU的内存不应该是空闲的。 当然,有可能避免这种情况,但我希望有良好和干净的RAII行为。有什么建议吗?
浏览 2
提问于2013-09-25
得票数 2
1
回答
CUBLAS中的异步和内存所有权
、
显然,
在
异步调用完成
之前
,CUBLAS操作的矩阵不应该被释放--但是标量参数呢?x, incx,return; 我担心
在
Saxpy实际启动时alpha可能不存在:如果我们
在
Saxpy启动
之前
返回函数,而alpha的堆栈空间被其他东西覆盖我不想将我的标量参数复制到某种堆内存中,并确保它们
在
异步调用CUBLAS之后才会被销毁--跟踪将变得非常复杂。如果CUBLAS明确保证标量参数不
需要
在调用CUBLAS之后存活,那就太好了,但是
浏览 0
提问于2014-08-01
得票数 3
回答已采纳
1
回答
创建CUDA上下文的差异
、
、
、
为了获得加速,我做了一个虚拟内存复制来创建一个上下文,如下所示:{}warmStart<<<1, 1>>>(dFlag);我还读到了创建
cudaFree
(0)或
cudaDevicesynchronize
()上
浏览 4
提问于2012-11-10
得票数 3
回答已采纳
1
回答
难以使用atomicMin
在
矩阵中找到最小值
我很难使用atomicMin
在
cuda中找到矩阵中的最小值。我确信这与传递给atomicMin函数的参数有关。findMin函数是要关注的函数,popmatrix函数只是用来填充矩阵。
浏览 3
提问于2021-04-20
得票数 0
回答已采纳
1
回答
在
幼崽类之后使用
cudaDeviceSynchronize
、
在从CUDA内核调用CUB类之后,有必要调用
cudaDeviceSynchronize
吗?当从设备中使用例如DeviceReduce::Sum()时,就会有隐式内存副本阻止设备继续前进,但是
在
使用GPU上调用的以下代码后,会遇到一些不稳定情况: arrMult<<< numBlocks, numThreads >>>(fluxes, lengths, lengths);
cudaDeviceSynchronize
();:
浏览 12
提问于2014-08-28
得票数 0
回答已采纳
1
回答
如何在CUDA中捕获重置机器的错误
、
、
程序运行正常,结果与
在
CPU上运行的结果一致。程序释放设备中使用的资源(
cudaFree
)并正常退出。此外,
在
退出
之前
,我使用了一个cudaDeviceReset()。内核
在
执行对全局存储器(即if ( idx < N ) ... )的读或写访问
之前
检查存储器位置索引
在
CPU中,循环
在
调用内核
之前
执行p cudaMalloc和cudaMemcpy(HtoD),在下一次迭代
之前
执行
cudaFree<
浏览 2
提问于2013-01-17
得票数 0
回答已采纳
1
回答
是否
有可能改变.NET数组分配方法?
、
、
、
我
在
.NET中通过P/Invoke使用CUDA。
在
CUDA中,它们提供了一种特殊的内存分配方法,它可以
在
GPU上分配内存,同时可以从主机(当然,从.NET的角度访问非托管内存)访问它们。那么,
是否
可以将默认的.NET数组内存分配方法更改为自定义的非托管内存分配?
在
该数组中,我只
需要
存储非常简单的基本类型,如int、double。例如,
在
CUDA C++中,它们覆盖new操作符,以使该类同时从CPU和GPU中看到:public:
浏览 1
提问于2015-09-14
得票数 1
回答已采纳
4
回答
什么时候打电话给
cudaDeviceSynchronize
?
、
、
何时真正
需要
调用
cudaDeviceSynchronize
函数? 据我从CUDA文档中了解到,CUDA内核是异步的,因此我们似乎应该在每次内核启动后调用
cudaDeviceSynchronize
。然而,除了
在
时间测量
之前
,我尝试了与任何
cudaDeviceSynchronize
相同的代码(训练神经网络)。我发现我得到了同样的结果,但是速度
在
7-12倍之间(取决于矩阵的大小)。因此,问题是,除了时间测量之外,
是否
有任何理由使用
cudaDevice
浏览 15
提问于2012-08-09
得票数 84
1
回答
cuda中的内存碎片
、
、
我试图
在
GPU中分配一个char数组(我猜这可能是内存碎片问题)。",dev_o); }
在
同样的情况下,我尝试
在
GP
浏览 3
提问于2013-05-16
得票数 2
回答已采纳
2
回答
如果使用cuda-memcheck,则会出现Cuda内核错误
、
我
在
每个内核代码之后都会用到这个。==================同样,它在cuda分析器上运行正常,
在
终端上没有cuda-memcheck,但是当使用cuda-memcheck时,它显示如下 ========= Program hit error 6 on CUDA+ 0x214) [0x
浏览 1
提问于2013-07-10
得票数 1
回答已采纳
1
回答
cudaMallocHost总是从内存错误中返回
我
在
初始化代码的第一步就尝试了cudaSetDevice(0)、
cudaDeviceSynchronize
()、cudaThreadSynchronize()和
cudaFree
(0),但它们不起作用。assert(result == cudaSuccess); return result;{
cudaDeviceSynchronize
();
cuda
浏览 6
提问于2014-08-23
得票数 0
回答已采纳
2
回答
我的CUDA内核中的printf()没有产生任何输出
、
我
在
CUDA程序中添加了一些printf()语句void DeviceFunc(floatDeviceFunc(a_h , numvar , b_h); //Showing the data ....同样
在
Kernel.cu
浏览 2
提问于2012-11-10
得票数 4
1
回答
在
使用nvprof进行分析时没有GPU活动
、
、
、
、
我
在
初始化数据、调用三个内核和释放数据的函数上运行nvprof.exe。我得到了这样的结果:
cudaFree
(b);
cudaFree
(c2);}
cudaFree
(b);
浏览 2
提问于2019-11-03
得票数 0
回答已采纳
1
回答
用于向量和的统一存储器实现
、
Launch Kernel
cudaDeviceSynchronize
=0; i<n; i++){}
浏览 13
提问于2022-04-28
得票数 -2
回答已采纳
3
回答
使用cuda初始化大图
我
在
Ubuntu 14.04上使用CUDA 7.5和NVIDIA GEFORCE 840M进行高清图像处理。我有一个3750*3750的图像,初始化这个维数的数组时遇到了麻烦。here, it does not complete the process
cudaDeviceSynchronize
(); initialize<<<blocksPerGrid,threadsPerBlo
浏览 45
提问于2017-01-26
得票数 0
1
回答
从常规C++代码调用__global__ CUDA函数
、
我正在向一个C++项目中添加一个使用CUDA的库。到目前为止,我要做的是从一个.cpp文件导入一个.cuh (或.h)头文件,然后由一个.cu文件实现这个头文件中的功能。但是这个头文件包含方法的声明,这些方法具有常规C++编译器所抱怨的__global__修饰符。 所以我想知道,从C++代码中使用静态CUDA库的正确方式是什么?
浏览 120
提问于2021-05-11
得票数 0
回答已采纳
1
回答
cuBLAS调用后的CUDA未知错误
、
、
、
、
在
我目前的项目中,我使用CUDA与cublasSgetrfBatched和cublasSgetriBatched计算矩阵的逆并返回结果。但是,虽然
在
调用第一个函数时没有收到错误消息,但以下对
cudaDeviceSynchronize
的调用将导致错误代码30:未知错误。; CUDA_CALL(
cudaDeviceSynchr
浏览 12
提问于2016-06-08
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
学习Java之前是否需要学习HTML
在人类出现之前,地球上是否曾存在过智慧生命?
小程序在开发之前需要了解的费用
在您开办公司之前需要考虑的事项
在入手智能灯之前 这些事情你需要知道
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券