本章节所提供的shfl系列函数, 具有4个主要版本.
分别是up/down, 即目标线程的编号可以通过简单的加减法来确定的时候.还有一种是叫xor, 这个是将线程编号进行异或操作。...所有的本章节的shfl函数都接受一个width参数,
可以在warp进步进一步的切分大小....未来的一些硬件可能对这些有特殊的优化....但用户能这样写就应当保持这样写, 以取得未来的更好效果.此外, 几乎如同一个惯例,虽然A家的硬件如此优秀, 不仅仅提供了wave内的shuffle功能, 还提供了特殊情况下的硬件优化,但很遗憾的是, 无论是这种优化...有不明白的地方,请在本文后留言
或者在我们的技术论坛bbs.gpuworld.cn上发帖