腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将
值
从
uint2
复制到
推力
中
的
一个
向量
?
、
、
我在vector<
uint2
> results (size)中有
值
,我只想把results.y
的
值
复制到
一个
vector<int> count (size)
中
。
浏览 1
提问于2017-02-13
得票数 0
回答已采纳
2
回答
如何使用
推力
和CUDA流异步将内存
从
主机
复制到
设备
、
、
、
我想使用
推力
将内存
从
主机
复制到
设备,如thrust::device_vector<float> d_vec(1 << 28);使用CUDA流类似于如何使用流将内存
从
设备
复制到
设备:
浏览 1
提问于2014-07-31
得票数 8
回答已采纳
1
回答
cuda
推力
:选择性复制和调整结果
、
我正在使用copy_if选择性地在两个
推力
装置阵列之间复制项目,如下所示: collated.begin(), is_valid_pt());is_valid_pt
的
实现方式是__ bool operator()(const float4 x) return x.w
浏览 7
提问于2015-05-31
得票数 0
回答已采纳
2
回答
推力
:基于另
一个
向量
有选择地复制
、
我想使用一组
推力
操作,根据第三个
向量
A
中
的
元素
的
谓词,有选择地将
一个
向量
C
的
元素
复制到
一个
新
的
向量
B
中
。这里有
一个
示例:当A
中
的
相应元素为1时,我希望将元素(按顺序)
从
B
复制到
C,如果元素为0,则不复制。如果B中有0%s,我希望使用|C| < |A|。我们可以通过减少B
浏览 26
提问于2021-09-06
得票数 1
回答已采纳
1
回答
Cuda thrust::device_vector
从
特定范围获取指针
、
、
、
我有
一个
矢量
向量
:它是
一个
连续
的
内存量,其中每个w项都表示
一个
向量
。在我
的
一个
函数
中
,我将该范围
的
开始和结束作为参数传递,如下所示: ) c
浏览 6
提问于2015-10-28
得票数 1
回答已采纳
1
回答
将数据
从
较小
的
向量
复制到
较大
的
向量
、
、
我正在使用
推力
在GPU项目上工作。我将不再试图解释我正在做
的
事情,而是提供
一个
简单
的
、略带一般性
的
场景,这个场景更容易解释,并可能在将来帮助其他人。1)使用像transform这样
的
推力
调用来修改每
一个
第三个元素,可能是用谓词或什么
的
。2)将第三
浏览 2
提问于2015-12-05
得票数 1
回答已采纳
1
回答
库达
推力
:
从
设备
复制到
设备
、
、
、
我使用标准CUDA malloc在CUDA中分配了
一个
内存数组,并将其传递给如下函数:我还有
一个
类成员,它是
一个
推力
device_ptr,声明为:这里,num_pts是数组
中
的
值
数,input_data现在,我想将输入数组<em
浏览 1
提问于2015-04-14
得票数 5
回答已采纳
1
回答
调用
推力
中
的
用户定义函数
、
、
、
我正在使用.png加载
一个
OpenCV文件,我希望使用
推力
库提取它
的
蓝色强度
值
。我
的
代码是这样
的
: 我已经在cuda
浏览 1
提问于2013-05-28
得票数 1
回答已采纳
1
回答
带压模顺序
的
CUDA
推力
remove_if
、
、
我试图根据第
一个
向量
的
值
从
两个thrust::device_vector<int>
中
删除元素。>= minThreshold不幸
的
是,
推力
文档说 因此,在我
的</em
浏览 3
提问于2014-09-18
得票数 0
回答已采纳
4
回答
六轴二维
向量
的
合并
、
、
为了表示速度、
推力
和其他这样
的
值
,BattleTech使用了
一个
6轴
推力
矢量,其轴名为A:下面是几个
推力
矢量
的
例子,它们都代表了以下
的
大小和方向:{ A = 2, B = 1, C =:<e
浏览 0
提问于2023-02-27
得票数 10
1
回答
CUDA数组/
向量
删除
、
、
我是CUDA
的
新手,正在尝试编写自己
的
内核。我希望每个GPU线程
从
它
的
向量
中
删除一些元素,然后我会将这些元素复制回主机。在CPU端,可比较
的
操作是:我
的
理解是,在GPU上不支持stl类型
向量
,并且我真的不能使用
推力</
浏览 17
提问于2017-03-17
得票数 1
回答已采纳
1
回答
CUDA
中
的
条件复制,其中数据
向量
比模板长
、
我想有条件地
从
向量
复制数据,基于模板
向量
,这是N倍短。模板
中
的
每个元素将负责数据
向量
中
的
N个元素。假设
向量
如下所示(N=3) data = {1,2,3,4,5,6,7,8,9} stencil = {1,0,1} 我希望得到
的
结果是: result = {1,2,3,7,8,9} 有没有办法使用
推力
库
中
的
函数来实现这一点first, InputIterator1
浏览 14
提问于2019-05-23
得票数 0
回答已采纳
1
回答
数据自动化系统能处理自己
的
工作队列吗?
、
抱歉,如果这是显而易见
的
,但是我现在正在学习c++和Cuda,我想知道这是否可能,这样我就可以更多地关注相关
的
部分了。保存数据(保存数据),丢弃数据(不对其做任何操作),进一步处理数据(它不确定该做什么,它修改数据并将其重新发送到队列以处理这曾经是
一个
递归,但我使每个部分都是独立<em
浏览 3
提问于2012-05-06
得票数 1
回答已采纳
1
回答
利用
推力
插入host_vector
、
、
我试图使用
推力
将
一个
值
插入到host_vector
中
的
第三个位置。我想使用
向量
将信息传递到GPU。我最初尝试使用
向量
向量
来表示包含不同数量数据
的
空间单元,但是学习到了
推力
是不可能
的
。因此,我使用
的
是
一个
向量
bins,它保存我
的
数据,按空间单元格排序(前3个
值
可能对应于第
一个
单元格,下
一
浏览 1
提问于2017-03-06
得票数 0
1
回答
CUDA:如何在图形处理器上直接使用thrust::sort_by_key?
、
、
推力
库可用于对数据进行排序。调用可能如下所示(带有
一个
键和
一个
值
向量
):在CPU上调用,d_keys和d_values在CPU内存
中
;大部分执行发生在GPU上。但是,我
的
数据已经在GPU上了?如何使用
推力
库直接在GPU上执行高效
的
排序,即从内核调用sort_by_key函数?此外,我
的</
浏览 0
提问于2013-03-25
得票数 8
1
回答
将尖头稀疏矩阵变量封装在
推力
指针
中
、
、
、
、
从
结果矩阵
中
,我需要最大
值
,而不需要将矩阵
从
设备内存
复制到
主机内存。我计划将结果矩阵封装在
推力
装置指针
中
,然后使用函数thrust::max_element获得最大元素。矩阵采用coo格式。如果C是乘积稀疏矩阵,则C.column_indices[]:包含列号因此,基本上,我需要C.values数组
的
最高
值
。int]" matc
浏览 2
提问于2012-10-30
得票数 0
回答已采纳
1
回答
如何由两个数组组成对
向量
,然后使用CUDA/Thrust对对
的
第
一个
元素进行排序?
、
、
、
、
我有
一个
指向序列化2D数组
的
指针,除了指针算法之外,我想从(本质上)两个数组(我计划
从
2D数组中提取
的
)中生成
一个
成对
的
向量
。然而,我需要使用
推力
库。--这是为了使我能够根据对
的
第
一个
元素
的
值
,在
向量
上使用
推力
::sort()。在设备上.因此,我需要
一个
向量
(最好是thrust::device_vector),
浏览 0
提问于2011-08-12
得票数 4
回答已采纳
2
回答
在主机上直接访问设备
向量
元素
的
最快方法
、
请参阅第二段,该段说 我搜遍了所有的文件,但找不到更有效
的
技术。有人知道最快
的
方法吗?例如,如何最快地访问主机上
的
设备
向量
/设备指针?
浏览 6
提问于2011-12-28
得票数 4
回答已采纳
1
回答
uint结构数组上
的
async_work_group_copy
、
、
、
我希望能够将结构数组
从
全局内存
复制到
本地内存。这些结构
的
类型如下: uint boo;} boo_moo; 我有
一个
名为B
的
boo_moo*指向
的
这些家伙数组,我希望能够将全局内存
中
B
的
内容
复制到
本地内存
中
称为B_loc
的
相当大
的
数组
中
。问题是,async_work_group_copy需要
一个
浏览 5
提问于2015-10-12
得票数 0
回答已采纳
1
回答
推力
:访问使用cudaMallocPitch创建
的
设备变量
、
、
我有
一个
数据矩阵,在可能
的
情况下,我应该使用GPU (以及
推力
库)对其进行一些阐述。到目前为止,我能够将数据
复制到
GPU并编写自己
的
内核函数。现在,基于内核函数
的
输出,我将利用
推力
库对相同
的
数据矩阵进行其他精化,如果可能的话,避免
从
GPU<->CPU下载和重新上传数据。因此,我使用cudaMallocPitch函数在GPU
中
创建了
一个
设备变量:size_t pi
浏览 2
提问于2015-04-21
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
博途中如何将数据块的实际值转到初始值中?
超赞!原来Excel数据来可以这样查询引用
深度学习,如何用去噪自编码器预测原始数据?
word2vec参数学习解释(一)
Excel数据合并,这招神技你要会用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券