当使用从GPU移植的训练有素的模型时，默认MaxPoolingOp仅在设备类型CPU错误时支持NHWC。

文章/答案/技术大牛

发布

1回答

、、

使用python，keras和tensorflow，我在PC上开发并训练了一个带有GPU ran预测等的模型，一切都很好。然后，我将模型和预测代码转移到一台装有requirements.txt的笔记本电脑上，重新构建了环境，将gpu包交换到cpu包。当我尝试运行预测代码时，我得到了一个我无法理解的错误。我的印象是tensorflow会透明地使用/不使用

浏览 239提问于2020-11-03得票数 1

1回答

在P100上运行tensorflow时出错

、

我用的是TF-1.60。无效参数:默认协调器仅支持设备类型CPU上的NHWC[[Node:v/ MaxPoolingOp _0/cg/mpool0/MaxPool= MaxPoolT=DT_FLOAT，data_format=:0"]] I0323 11:02:22.115472 47942823427200 tf_logging.py:116]向协调器报告错误：，默认</em

浏览 9提问于2018-03-23得票数 0

2回答

ResNet模型在Tensorflow联邦中的应用

、、、

我试着在Tensorflow Federated中的“图像分类”教程中定制该模型。(它最初使用顺序模型)我使用Keras ResNet50，但是当它开始训练时，总是会出现“不兼容形状”的错误。这是我的密码：NUM_EPOCHS = 10SHUFFLE_BUFFER = 5 it

浏览 0提问于2020-01-07得票数 1

2回答

将Caffe作为CPU运行--只在GPU* Caffe成功安装之后才能运行。*

、、、

我有一个码头形象与Caffe编译与cudnn支持。CUDA和所有其他依赖项都正确地安装在映像中，当使用nvidia-docker从主机提供驱动程序时，它可以正常工作。就好像用cudnn支持构建Caffe会导致Caffe要求GPU驱动程序。这对我的用例来说是有问题的:提供一个单独的Docker映像，它可以作为基于CPU的映像或基于GPU的映像互换使用</em

浏览 0提问于2017-05-24得票数 1

回答已采纳

7回答

RuntimeError:输入类型(torch.FloatTensor)和权重类型(torch.cuda.FloatTensor)应该相同

、、、、

这是：model.to(device) inputs, labels = data给出错误： RuntimeError:输入类型(torch.FloatTensor)和权重类型(torch.cuda.FloatTensor)应该是相同的</

浏览 7提问于2019-11-23得票数 141

回答已采纳

1回答

不同数据格式的冻结图

、

我编写了一个小助手函数来使用默认值调用Tensorflow的freeze_graph函数，给定一个包含检查点文件和graph.pbtxt的目录：import argparse 从</em

浏览 3提问于2017-10-30得票数 4

1回答

Tensorflow是否“知道”何时不将数据放入GPU？

、、、、

它似乎不使用任何额外的GPU内存，从内存已经被使用。sess.run(rand + 2 ,feed_dict={rand:random_value}) # forced to do some calculation 还有一个额外的GPU使用在所有上述实验中，我将我的<

浏览 1提问于2018-01-12得票数 3

回答已采纳

2回答

是否可以强迫cudaMallocManaged在特定的gpu* id上分配(例如通过cudaSetDevice)*

、、、

我想使用cudaMallocManaged，但是否可能强制它在多个gpu系统上分配特定GPU id (例如通过cudaSetDevice)上的内存？原因是我需要在GPU上分配几个数组，而且我知道这些数组的哪一组需要一起工作，所以我想手动确保它们在同一个GPU上。我搜索了CUDA的文件，但没有找到任何与此相关的信息。有人能帮忙吗？谢谢!

浏览 18提问于2022-09-03得票数 0

回答已采纳

13回答

如何检查PyTorch是否正在使用GPU？

、、、、

如何检查PyTorch是否正在使用GPU？nvidia-smi命令可以检测GPU活动，但我想直接从Python中检查它。

浏览 19提问于2018-01-08得票数 429

回答已采纳

2回答

LibGDX:最大纹理数？

、、、、

我一直在开发一个针对android的游戏。我知道在项目完成之前不要考虑程序优化，但我想知道大多数手机在不熔化或破坏电池的情况下能安全地处理多少纹理。我已经看到，纹理的最大大小应该是1024或2048像素平方(我一直在将雪碧片合并成1024x1024地图集)，但我不禁想知道我在运行时可以使用多少像素。我知道它应该依赖GPU，但是是什么规范决定了它呢？

浏览 0提问于2016-11-20得票数 1

回答已采纳

1回答

InvalidArgumentError:默认MaxPoolingOp仅支持设备类型CPU上的NHWC

、、、

import Sequentialfrom keras.models import model_from_json

浏览 36提问于2020-11-04得票数 1

回答已采纳

1回答

在Beam/Google数据流上调试一条慢速PyTorch GPU推断流水线

、、、

我们正在尝试使用Google构建一个简单的基于GPU的分类管道，如下所示: Pub/Sub请求附带指向GCS上的文件的链接，→从GCS→读取数据，→Chop向上读取数据，以及在→中进行批处理数据→运行推断目前，在数据流上对RunInference没有GPU支持(参见未发布的)。在部署到Dataflow之前，在本地构建Beam管道时，模型初始化步骤不识别CUDA环境，<em

浏览 10提问于2022-08-10得票数 1

3回答

OpenCL与中央调度的并发编程

、、、、

随着OpenCL 2.0的引入，OpenCL似乎具备了GCD的许多特性，比如CLang/OpenCL风格的块和队列。查看它们各自的功能集，我想知道OpenCL是否能够完成GCD /lib分派所能做的所有事情，但是否具有将计算导向GPU和CPU的额外能力--或者GCD是否可以提供与OpenCL无关的更多功能。具体来说，我的问题是：

浏览 8提问于2014-02-01得票数 4

回答已采纳

4回答

我曾经玩过CPU组装编程，比如Nasm、Tasm或Masm，但我真的很想知道GPU现在是如何工作的。然而，当我看到互联网时，我感到很困惑。我听说过Cuda和OpenCL，但这不是我想要的。我想知道GPU指令是如何在RAM中.对于大多数GPU，Nasm和Masm是什么？GPU的x86或Z80是什么(GPU的不同家族)？你知道构造函数操作码参考手册吗？我想我真的需要一些东西来比较这两个处理单元，因为<e

浏览 0提问于2018-07-14得票数 21

回答已采纳

2回答

OpenCL，Vulkan，Sycl

、、

我正在努力理解OpenCL生态系统以及Vulkan是如何发挥作用的。 SYCL是一种新的规范，它允许将OpenCL代码作为符合标准的C++14编写，据我所知，目前还没有这个规范的免费实现。我知道OpenCL级别更高，并且抽象设备，但是(或者可以)

浏览 0提问于2016-11-20得票数 37

回答已采纳

4回答

tensorflow Mac支持

、

根据是必需的。要使CUDA / tensorflow发挥作用，还需要什么？

浏览 7提问于2017-06-25得票数 35

2回答

如何在UIKit中检测用户设备是否具有动态孤岛？

、、

在我的应用程序中，我实现了pull-to-refresh特性和自定义加载图标。在IPhone中，它有动态岛，它重叠了我的加载图标。我想检测有无动态岛的设备。如果有，我会给它增加一些顶部空间。

浏览 21提问于2022-10-04得票数 0

回答已采纳

1回答

tensorflow -如何使用16位精度浮点数

、、、

问题float16只在16位支持的GPU实例上运行时才可用吗？现代加速器在16位数据类型中可以运行得更快，因为它们有专门的硬件来运行16位计算，16位数据类型可以更快地从内存中读取。因此，应尽可能在这些设备上使用这些低精度的dtype.但是，由于数值上的原因，变

浏览 8提问于2021-04-06得票数 2

4回答

OpenCL:工作组概念

、

我不太明白OpenCL中工作组的目的。然而，为什么需要更粗的细分呢？只有线程网格(事实上，只有一个W-G)，难道不是可以的吗？而且，据我所知，由于内存限制，工作组中的工作项可以同步。工作小组可以同步吗?或者这甚至是必要的？他们是通过共享内存相互交谈，还是仅仅是为了工作项目(不确定这一项)？

浏览 6提问于2014-11-07得票数 30

回答已采纳

3回答

在多处理器环境中，是否可以同时执行多条加载/存储指令

、、、、

我相信在单处理器系统中，不止一个商店会一个接一个地发生，但多处理器系统的情况又如何呢？增加了一个问题，如果机器是32位的，当我们尝试将一个长的int(64位)值写入内存时，Load/Store指令将如何行为？上面两个问题的原因是，如果有人试图在另一个线程中读取相同的内存( 32位/64位大小的内存，在32位系统中)，这是否安全，或者我是否需要考虑使用锁。添加：我想尽可能地减少锁，因为我们的执行是时间关键的

浏览 6提问于2014-07-03得票数 1

点击加载更多