腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
推力
::
reduce
的
sum
值
不正确
、
、
、
、
我一直在尝试实现一些需要在thrust::device_ptr上调用
reduce
的
代码,在处理大
值
时,结果与CPU实现
的
结果不一致。我必须处理较大
的
值
。= thrust::
reduce
(dev_ptr, dev_ptr+NZ*NX, 0, thrust::plus<real>()); cout<<"\nsum gpu "<<
sum
1<<
浏览 20
提问于2021-01-27
得票数 0
回答已采纳
1
回答
推力
对阵列缩减非常缓慢。
、
、
、
、
我试图使用
推力
将包含1M元素
的
数组缩减为单个
值
。
sum
= thrust::
reduce
(D.begin(),D.end(),(float)0,thrust::plus<float>());} 问题是,仅在我
的
RTX 3070笔记本电脑GPU上运行thrust::
reduce
就需要大约4ms。
推力
:减少现在需要2ms来运行。<flo
浏览 8
提问于2022-03-18
得票数 0
回答已采纳
1
回答
利用内核内
推力
进行CUDA约简
、
、
、
我想做并行缩减,但是在我
的
内核中,数据在共享内存中。有没有可能使用
推力
库?就像这样但这在内核中是行不通
的
。
浏览 3
提问于2012-04-16
得票数 0
回答已采纳
1
回答
无法调用CUDA存储器
的
推力
、
我试图使用
推力
库找到数组
的
总和(已经存在于CUDA内存中)。这里很少有回复说,通过使用thrust::device_ptr包装它是可能
的
,但是它正在为我抛出一个错误。= thrust::
reduce
(vec.begin(), vec.end());thrust::device_ptr<unsigned int> outputPtrEnd((d_output + stride + (rows * cols)));
sum</em
浏览 1
提问于2014-10-28
得票数 0
回答已采纳
1
回答
推力
减少不适用于不相等
的
输入/输出类型
、
我试图用
推力
来减少一组
值
的
最小和最大
值
,但我似乎被卡住了。给定一个浮点数组,我希望在一次遍历中减少它们
的
最小和最大
值
,但是使用
推力
的
reduce
方法,我得到了所有模板编译错误
的
母亲(或者至少是姑妈)。我
的
原始代码包含分布在2个float4数组中
的
5个
值
列表,我希望减少这些
值
,但我已经将其简化为这个简短
的
示例。我
的</em
浏览 0
提问于2012-05-11
得票数 1
回答已采纳
2
回答
请帮助我调试有关Javascript中for/in
的
错误。
var courses = [1, 2, 3, 4]; var
sum
; return total + number;该程序用于定义
reduce
2函数,计算数组中<em
浏览 4
提问于2021-02-07
得票数 1
回答已采纳
1
回答
在调用其他CUDA函数后使用thrust::
reduce
、
在使用我自己
的
CUDA函数之后,我正在尝试调用一个CUDA::
reduce
函数。下面是问题: 如果我在我
的
CUDA函数之前使用just::
reduce
(只是为了测试),一切都很好,没有错误,没有抛出。但是,如果在运行我
的
CUDA函数后调用CUDA::
reduce
,则会弹出一条消息: cudaErrorLaunchOutOfResources(7): [.../dispatch_
reduce
.cuh, 646]: too many resources requ
浏览 63
提问于2020-04-13
得票数 0
2
回答
这样
的
事情在CUDA中是可能
的
吗
、
、
、
比方说,我有一个
值
为0或1
的
矩阵。} { }所以我最终得到了矩阵中
的
n我知道,这是一个非常简单
的
例子,但是如果这是可能
的
,那么还有其他
的
变种...
浏览 0
提问于2014-03-21
得票数 0
3
回答
CUDA
推力
大幅度降低
、
我有一个具有这种结构
的
顶点数组: [x0, y0, z0, empty float, x1, y1, z1, empty float, x2, y2, z2, empty float, ...]我写了一个适当
的
约简算法,但它似乎有点太慢了。我决定使用
推力
库。有一种高度优化
的
reduce
() (甚至更好
的
minmax_element() )方法,它可以同时找到数组
的
最大
值
和最小
值
,但我无法找到一种快速使用
的
方法--然后
浏览 3
提问于2014-07-20
得票数 5
回答已采纳
1
回答
推力
输出
的
位置::减少操作(GPU RAM或CPU RAM)?
、
、
、
在下面的示例中,当我们使用
推力
::还原时,输出是一个int。此输出(代码中
的
和变量)是否位于GPU或CPU上?#include <thrust/execution_policy.h>{ thrust::device_vector<int>
浏览 0
提问于2018-11-21
得票数 0
回答已采纳
1
回答
为什么不减少工作呢?
在Hadley
的
书“Advanced”中有两个函数
Reduce
()
的
例子,它们都工作得很好。
Reduce
(`+`, 1:3) # -> ((1 + 2) + 3)但是,当在mean中使用
Reduce
()时,它并不遵循相同
的
模式结果总是列表中
的
第一个元素。 >
Reduce
(mean,
浏览 1
提问于2016-02-23
得票数 4
回答已采纳
1
回答
与
推力
相似的幼崽模板
、
、
、
、
以下是主旨代码:在这里,thrust::
reduce
接受第一个和最后一个输入迭代器,
推力
将
值
返回给CPU(复制到h_in_value)。作为输入
的
第一迭代器和最后迭代器 将结果返回到主机
浏览 7
提问于2017-05-11
得票数 2
回答已采纳
1
回答
CUDA gdb
推力
碰撞(CUDA第5.5版)
、
我有以下一些琐碎
的
要点::from程序(直接摘自thrust::from文档)#include <thrust/device_vector.h>我还做了相应
的
扩展 其中,只有最后三个(in
浏览 1
提问于2013-07-17
得票数 0
回答已采纳
1
回答
不使用device_vectors
的
Cuda
推力
?
、
、
我已经使用普通
的
CUDA代码编写了内核,这些代码不使用
推力
设备矢量。内核输出一些存储在设备上
的
数组中
的
结果,比如数组X。现在我想对X进行一次约简。有没有一种方法可以在不先将X复制到thrust::device_vector变量中
的
情况下使用into::device函数?
浏览 2
提问于2016-05-08
得票数 1
1
回答
推力
/库达
reduce
_by_key误差?
、
、
我面临着
reduce
_by_key函数
的
推力
库
的
问题。在我看来,这好像是个窃听器,但我想在报告之前先确认一下。. 7、8、9、6 现在,我确信,dev
浏览 2
提问于2015-08-12
得票数 1
回答已采纳
1
回答
采用binary_function和多种类型降低
推力
、
如何使用具有多种类型
的
binary_functions使用
推力
降低?在我
的
例子中,我有一个结构FaceUV,它有一个成员‘距离’。我想用距离来数所有的FaceUV != 0。我该怎么做?我以为是这样
的
,但它没有编译: struct FaceHasUVCmp : public thrust::binary_function<FaceUV, uint32_t, uint32_t> {get_percent_of_FACES_with_UVs(thrust::device_ptr<FaceUV> face
浏览 2
提问于2017-03-01
得票数 0
回答已采纳
2
回答
CUDA在共享内存中查找最大
值
、
、
、
、
我有一个内核,它生成一个结果
值
数组,我希望高效地找到这些
值
的
最大
值
。数组是在内核
的
开头用一些负值(例如-1)初始化
的
。例如,内核使用5个块执行,每个块有256个线程。以下是问题所在: 因为我
的
数据,我必须终止线程,这是无效
的
,所以我有时使用256个线程,有时是50,20个等等。在共享内存中,从块写入结果,但正如我所提到
的
,一些数组有50个结果,一些有256个结果.(共享数组如下所示) 8,6,4,9,1,-1,-1,-1.在这种情
浏览 2
提问于2012-04-19
得票数 0
回答已采纳
3
回答
不带Jquery
的
数组之和
、
现在我已经研究过.
reduce
了但这是一个运行错误。我也想我可以试着做我自己
的
计数器... var
sum
= 0;
sum
+= array[i]; return
sum
;但即使这样做对我也不
浏览 1
提问于2016-11-12
得票数 3
1
回答
cuda: cpu和gpu减少
的
不同答案
、
我犯了个很奇怪
的
错误。我用
推力
缩减法对矩阵中
的
所有元素进行了求和。它对大多数数据运行良好,但在一组数据上出错了。代码: thrust::device_ptr<lbfgsfloatval_t> ptr(A.getPtron host sums += A_p[i]; //
浏览 5
提问于2013-09-24
得票数 2
回答已采纳
1
回答
我可以用CUDA幼崽迭代器代替
推力
吗?
、
、
、
是否有可能使用迭代器与幼崽一样
的
推力
?我不想用幼崽代替
推力
,如下所示: float resultat = 0; resultat = thrust::
reduce
result
浏览 3
提问于2018-10-09
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python的sum、map、filter和reduce
Python 闭包
Python那些事——Python之函数式编程!
Hadoop进级教程之-MapReduce代码实战
函数补充,高阶函数
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券