我计划购买一个严肃的GPU来运行并行算法(预算2k-4k)。现在我看到到处都是具有GPGPU特斯拉GPU卡的超级计算机“专门为nVidia制造的”。
虽然乍一看这似乎非常好,但更好的阅读让我认真地重新思考:与Radeon HD 7970相比,它的性能(在flops方面)要低得多,它的成本价格要高得多,我似乎找不到特斯拉和普通游戏GPU之间的基准比较。
我发现特斯拉配备了ECC-memory。这是唯一的区别吗?或者我错过了两者之间更深层次的架构差异?也许相关信息:我将使用OpenCL,而不是Cuda。
发布于 2012-02-02 05:04:56
当你比较相似的卡片时,我知道两个品牌之间的技术差异。
1) Nvidia显卡往往比AMD具有更好的双精度FLOPS -有时是AMD的2倍。AMD通常在单精度FLOPS上做得更好。
2)两个品牌的GDDR5内存均提供ECC内存。不同之处在于,Nvidia在内部存储器(寄存器等)上也使用ECC,而AMD不使用ECC。
在我看来,根据你的申请来选择卡片。如果您使用的单精度大于双精度,请使用AMD,否则使用Nvidia。如果您需要ECC来实现高容错性,Nvidia也许是您的最佳选择。有时,许多较便宜的卡比1或2个顶级线卡性能更好-想想PCI-e带宽。阅读基准测试,并尝试确定哪种卡最适合您的需求。
发布于 2012-02-02 04:41:46
我不知道你的问题是否类似于挖掘比特币,但这里有很多关于并行GPU设置的信息……
https://stackoverflow.com/questions/9102991
复制相似问题