我正在尝试使用Visual Studio 2010配置CUDA6.0。我使用CUDA 6.0运行时创建了一个项目。编译时,是否需要更改/添加任何选项?由于我的CUDA代码运行速度比串行版本慢,有没有可能代码不是并行执行的(例如,GPU变成一个慢CPU...),而不考虑其他可能性,例如双精度、开销等?
非常感谢,XF
我使用支持GPU的Torch和Numpy使用下面的函数执行元素级乘法,发现Numpy循环比Torch快--这不应该是这样,我对此表示怀疑。定义默认的张量类型以启用全局GPU标志。torch.FloatTensor)x = torch.Tensor(200, 100) # Is FloatTensor
y = torch.Tensor(200,10