如何将值从uint2复制到推力中的一个向量？

、、

我在vector<uint2> results (size)中有值，我只想把results.y的值复制到一个vector<int> count (size)中。

浏览 1提问于2017-02-13得票数 0

回答已采纳

2回答

如何使用推力和CUDA流异步将内存从主机复制到设备

、、、

我想使用推力将内存从主机复制到设备，如thrust::device_vector<float> d_vec(1 << 28);使用CUDA流类似于如何使用流将内存从设备复制到设备：

浏览 1提问于2014-07-31得票数 8

回答已采纳

1回答

cuda推力:选择性复制和调整结果

、

我正在使用copy_if选择性地在两个推力装置阵列之间复制项目，如下所示： collated.begin(), is_valid_pt());is_valid_pt的实现方式是__ bool operator()(const float4 x) return x.w

浏览 7提问于2015-05-31得票数 0

回答已采纳

2回答

推力:基于另一个向量有选择地复制

、

我想使用一组推力操作，根据第三个向量A中的元素的谓词，有选择地将一个向量C的元素复制到一个新的向量B中。这里有一个示例:当A中的相应元素为1时，我希望将元素(按顺序)从B复制到C，如果元素为0，则不复制。如果B中有0%s，我希望使用|C| < |A|。我们可以通过减少B

浏览 26提问于2021-09-06得票数 1

回答已采纳

1回答

Cuda thrust::device_vector从特定范围获取指针

、、、

我有一个矢量向量：它是一个连续的内存量，其中每个w项都表示一个向量。在我的一个函数中，我将该范围的开始和结束作为参数传递，如下所示： ) c

浏览 6提问于2015-10-28得票数 1

回答已采纳

1回答

将数据从较小的向量复制到较大的向量

、、

我正在使用推力在GPU项目上工作。我将不再试图解释我正在做的事情，而是提供一个简单的、略带一般性的场景，这个场景更容易解释，并可能在将来帮助其他人。1)使用像transform这样的推力调用来修改每一个第三个元素，可能是用谓词或什么的。2)将第三

浏览 2提问于2015-12-05得票数 1

回答已采纳

1回答

库达推力:从设备复制到设备

、、、

我使用标准CUDA malloc在CUDA中分配了一个内存数组，并将其传递给如下函数：我还有一个类成员，它是一个推力device_ptr，声明为：这里，num_pts是数组中的值数，input_data现在，我想将输入数组<em

浏览 1提问于2015-04-14得票数 5

回答已采纳

1回答

调用推力中的用户定义函数

、、、

我正在使用.png加载一个OpenCV文件，我希望使用推力库提取它的蓝色强度值。我的代码是这样的：我已经在cuda

浏览 1提问于2013-05-28得票数 1

回答已采纳

1回答

带压模顺序的CUDA推力remove_if

、、

我试图根据第一个向量的值从两个thrust::device_vector<int>中删除元素。>= minThreshold不幸的是，推力文档说因此，在我的</em

浏览 3提问于2014-09-18得票数 0

回答已采纳

4回答

六轴二维向量的合并

、、

为了表示速度、推力和其他这样的值，BattleTech使用了一个6轴推力矢量，其轴名为A：下面是几个推力矢量的例子，它们都代表了以下的大小和方向：{ A = 2, B = 1, C =：<e

浏览 0提问于2023-02-27得票数 10

1回答

CUDA数组/向量删除

、、

我是CUDA的新手，正在尝试编写自己的内核。我希望每个GPU线程从它的向量中删除一些元素，然后我会将这些元素复制回主机。在CPU端，可比较的操作是：我的理解是，在GPU上不支持stl类型向量，并且我真的不能使用推力</

浏览 17提问于2017-03-17得票数 1

回答已采纳

1回答

CUDA中的条件复制，其中数据向量比模板长

、

我想有条件地从向量复制数据，基于模板向量，这是N倍短。模板中的每个元素将负责数据向量中的N个元素。假设向量如下所示(N=3) data = {1,2,3,4,5,6,7,8,9} stencil = {1,0,1} 我希望得到的结果是： result = {1,2,3,7,8,9} 有没有办法使用推力库中的函数来实现这一点first, InputIterator1

浏览 14提问于2019-05-23得票数 0

回答已采纳

1回答

数据自动化系统能处理自己的工作队列吗？

、

抱歉，如果这是显而易见的，但是我现在正在学习c++和Cuda，我想知道这是否可能，这样我就可以更多地关注相关的部分了。保存数据(保存数据)，丢弃数据(不对其做任何操作)，进一步处理数据(它不确定该做什么，它修改数据并将其重新发送到队列以处理这曾经是一个递归，但我使每个部分都是独立<em

浏览 3提问于2012-05-06得票数 1

回答已采纳

1回答

利用推力插入host_vector

、、

我试图使用推力将一个值插入到host_vector中的第三个位置。我想使用向量将信息传递到GPU。我最初尝试使用向量向量来表示包含不同数量数据的空间单元，但是学习到了推力是不可能的。因此，我使用的是一个向量bins，它保存我的数据，按空间单元格排序(前3个值可能对应于第一个单元格，下一

浏览 1提问于2017-03-06得票数 0

1回答

CUDA:如何在图形处理器上直接使用thrust::sort_by_key？

、、

推力库可用于对数据进行排序。调用可能如下所示(带有一个键和一个值向量)：在CPU上调用，d_keys和d_values在CPU内存中；大部分执行发生在GPU上。但是，我的数据已经在GPU上了？如何使用推力库直接在GPU上执行高效的排序，即从内核调用sort_by_key函数？此外，我的</

浏览 0提问于2013-03-25得票数 8

1回答

将尖头稀疏矩阵变量封装在推力指针中

、、、、

从结果矩阵中，我需要最大值，而不需要将矩阵从设备内存复制到主机内存。我计划将结果矩阵封装在推力装置指针中，然后使用函数thrust::max_element获得最大元素。矩阵采用coo格式。如果C是乘积稀疏矩阵，则C.column_indices[]：包含列号因此，基本上，我需要C.values数组的最高值。int]" matc

浏览 2提问于2012-10-30得票数 0

回答已采纳

1回答

如何由两个数组组成对向量，然后使用CUDA/Thrust对对的第一个元素进行排序？

、、、、

我有一个指向序列化2D数组的指针，除了指针算法之外，我想从(本质上)两个数组(我计划从2D数组中提取的)中生成一个成对的向量。然而，我需要使用推力库。--这是为了使我能够根据对的第一个元素的值，在向量上使用推力：：sort()。在设备上.因此，我需要一个向量(最好是thrust::device_vector)，

浏览 0提问于2011-08-12得票数 4

回答已采纳

2回答

在主机上直接访问设备向量元素的最快方法

、

请参阅第二段，该段说我搜遍了所有的文件，但找不到更有效的技术。有人知道最快的方法吗？例如，如何最快地访问主机上的设备向量/设备指针？

浏览 6提问于2011-12-28得票数 4

回答已采纳

1回答

uint结构数组上的async_work_group_copy

、、、

我希望能够将结构数组从全局内存复制到本地内存。这些结构的类型如下： uint boo;} boo_moo; 我有一个名为B的boo_moo*指向的这些家伙数组，我希望能够将全局内存中B的内容复制到本地内存中称为B_loc的相当大的数组中。问题是，async_work_group_copy需要一个

浏览 5提问于2015-10-12得票数 0

回答已采纳

1回答

推力:访问使用cudaMallocPitch创建的设备变量

、、

我有一个数据矩阵，在可能的情况下，我应该使用GPU (以及推力库)对其进行一些阐述。到目前为止，我能够将数据复制到GPU并编写自己的内核函数。现在，基于内核函数的输出，我将利用推力库对相同的数据矩阵进行其他精化，如果可能的话，避免从GPU<->CPU下载和重新上传数据。因此，我使用cudaMallocPitch函数在GPU中创建了一个设备变量：size_t pi

浏览 2提问于2015-04-21得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用推力和CUDA流异步将内存从主机复制到设备

cuda推力:选择性复制和调整结果

推力:基于另一个向量有选择地复制

Cuda thrust::device_vector从特定范围获取指针

将数据从较小的向量复制到较大的向量

库达推力:从设备复制到设备

调用推力中的用户定义函数

带压模顺序的CUDA推力remove_if

六轴二维向量的合并

CUDA数组/向量删除

CUDA中的条件复制，其中数据向量比模板长

数据自动化系统能处理自己的工作队列吗？

利用推力插入host_vector

CUDA:如何在图形处理器上直接使用thrust::sort_by_key？

将尖头稀疏矩阵变量封装在推力指针中

如何由两个数组组成对向量，然后使用CUDA/Thrust对对的第一个元素进行排序？

在主机上直接访问设备向量元素的最快方法

uint结构数组上的async_work_group_copy

推力:访问使用cudaMallocPitch创建的设备变量

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐