, 给大家带来的震撼吗),以及, GPU上海量并行的应用, 以及, 到多卡系统, CPU-GPU交互的普及, 不使用原子操作将会越来越变得寸步难行。...大约在我刚刚尝试开始使用CUDA的时候, 我曾经面临过8800GTX(初代的1.0计算能力的卡, 不支持任何原子操作), 和当年的小珍珠GT240的艰难选择....但是还是不能满足我的要求,但是如果能同时算上CPU的计算性能, 则差不多正好,(CPU的核心们提供了好几十个百分点提升, 刚才的性能比较是单核的),然后客户继续说, 我尝试使用unified memory...来做这个, 但是我有两个问题无法解决 :(1)没法同时CPU上的原子操作和GPU上的原子操作协同起来(Pascal的系统级的原子操作支持). (2)Unified Memory不能同时使用, GPU在用...此外, 还需要补充的是:一些书或者网上有一些特别的技巧,例如可以通过atomicCAS, 来实现一些互斥锁之类的东西,请在使用前确保你已经充分了解了这些所谓的技巧, 我们不建议使用它们的.