当我试图捕获流执行以构建CUDA图时,调用thrust::reduce会导致运行时错误cudaErrorStreamCaptureUnsupported: operation not permitted我已经尝试将缩减结果返回给主机和设备变量,并且我正在通过thrust::cuda::par.on(stream)的方式在适当的流中调用缩减。有没有方法可以将thrust函数的执行添加到CUDA图中?
我有一个结构,如{ int y;}
我打算使用这个结构来表示稀疏矩阵(我知道CUSPARSE和CUSP,但我只打算使用推力执行一些测试),并使用推力算法执行操作。根据我在CUDA编程教程中所学到的,为了更好地进行内存合并,建议使用数组的结构而不是结构的数组。如果是这样,那么如果我使用上面提到的结构在device_vector中存储非零(以百万为数量