我很难理解multiProcessorCount属性所代表的价值,因为我在掌握CUDA体系结构方面遇到了困难。
如果下面的一些说法显得很幼稚,我很抱歉。根据我迄今为止的理解,以下是硬件“层”:
在软件方面:
在这两种情况下,允许启动的最大线程数和块数与卡上实际存在的每个流处理器的流多处理器、流处理器和硬件线程的数量无关。这些想法都是软件!
我至少接近现实了吗?
话虽如此,multiProcessorCount属性提供了什么呢?上面写着我只有一个多处理器..。这是否意味着我只有一个流多处理器?我会有一个只由一个流多处理器组成的构建块吗?这对我来说是不可能的。这意味着我一次只能执行一个块!此外,当我的卡的规格说明说我有48个cuda核时,他们是在谈论流处理器吗?
发布于 2013-05-20 09:29:03
也许this answer会有所帮助。它现在有点过时了,因为它指的是旧的体系结构,但是原则是一样的。
GPU完全有可能由单个SM (流式多处理器)组成,特别是当它是移动GPU时。该单SM由多个CUDA核心组成,可以容纳多个线程块(在最新开普勒一代GPU上最多可容纳16个线程)。
在您的例子中,您的6.1亿GPU有一个流多处理器(SM),由48个CUDA核心(也称为流处理器,SPs)组成。
https://stackoverflow.com/questions/16639766
复制相似问题