gpu使用_pytorch使用gpu_使用c#使用GPU - 腾讯云开发者社区

、

我有一个GPU工作站与48核心CPU +4 NVIDIA GPU。我将使这台机器成为一个包含以下内容的小型集群： 4节点12核心+1 CPU/节点我用命令在这台机器上安装了扭矩： ./configure --without-tcl --enable-nvidia-gpus --prefix=/soft/torque-5.1.1 --with-nvml-include=/usr/local/cuda/gpukit/usr/include/nvidia/gdk --with-nvml-lib=/usr/local/cuda/lib64 然后，我将/etc/hosts设置为： 127.0.0.1

浏览 0提问于2015-07-01得票数 -1

1回答

TensorFlow仅适用于GPU0

、、、

我很难尝试在GPU1中运行tensorflow程序。无论我是使用CUDA_VISIBLE_DEVICES=1 python program.py还是在程序中使用tf.device('/gpu:1')，我总是收到以下错误： I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:900] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA

浏览 0提问于2016-03-12得票数 1

6回答

valueError在keras中使用multi_gpu_model时

、、、、

我使用谷歌云VM与4特斯拉K80 GPU的。我使用multi_gpu_model和gpus=4运行一个keras模型(因为我有4个gpu)。但是，我得到了以下错误 ValueError:要用gpus=4调用multi_gpu_model，我们希望有以下设备可用：'/cpu:0‘、'/gpu:0’、'/gpu:1‘、'/gpu:2’、'/gpu:3‘。然而，这台机器只有：'/cpu:0'，'/xla_cpu:0'，'/xla_gpu:0'，'/gpu:0‘。尝试减少gpus。我可以看到这里

浏览 0提问于2018-10-23得票数 3

回答已采纳

1回答

基于LSTM网络的GPU上的Keras慢速

、、、、

我在用角星训练我的模特。当我比较GPU和CPU的性能时。CPU版本比GPU版本快得多。我如何修正下面的这些错误？我试图强迫tensorflow到GPU，我得到了以下错误： tensorflow.python.framework.errors_impl.InvalidArgumentError: Cannot assign a device to node 'gradients/simple_rnn_1/while/Select_1_grad/Select/f_acc': Could not satisfy explicit device specification

浏览 1提问于2017-05-03得票数 6

1回答

openmp部分中的Opencl独立队列和clFinish

、、

我正在制作一个opencl包装器，它对每个缓冲区使用不同的命令队列。所有的读写操作都是非阻塞的。问题是，其中一个读/写操作没有发出(从分析器看似乎是这样)。CodeXL分析器显示漏洞。我在照片上做了标记。问题:是什么导致了这个问题？我检查cl错误，但都给出了CL_SUCCESS.。 c++ OpenCL1.2程序的流程： (from main thread) issue write buffer 0 issue write buffer 1 issue write buffer N (from many threads by openmp body

浏览 3提问于2014-02-08得票数 1

回答已采纳

1回答

GPU如何使用的元流解释

、、、

目标了解GPU将如何在元流中使用。背景在中，有几个关于如何使用GPU的讨论。它看起来像@resources(GPU=2)负责GPU分配，但有一些讨论指出AWS EC2实例类型与GPU，如P或G实例，也是类型的AMI。据我理解，Metaflow使用AWS批处理，它使用ECS/Docker。然后，码头实例需要在码头容器()内的GPU驱动程序能够访问GPU。因此，不清楚元流如何管理GPU，以及使用GPU所需的先决条件、配置和编码是什么。问题我们是否需要使用在EC2实例(停靠主机)级别预配置GPU驱动程序的特定AMI？我们是否需要在GPU中使用特定的EC2类型(P3、P4、G

浏览 3提问于2020-07-07得票数 0

1回答

Tensorflow具有多个GPU的多个会话

、

我有一个带有2个GPU的工作站，并且我正在尝试同时运行多个tensorflow作业，因此我可以同时训练多个模型，等等。例如，我尝试通过在script1.py中使用的python API将会话分离到不同的资源中： with tf.device("/gpu:0"): # do stuff 在script2.py中： with tf.device("/gpu:1"): # do stuff 在script3.py中 with tf.device("/cpu:0"): # do stuff 如果我单独运行每个脚本，我可以看到它正

浏览 2提问于2016-01-14得票数 26

回答已采纳

1回答

当使用Slurm时，如何在一个节点中对GPU进行分组？

情境:我有一个4个GPU在一个节点，我想分组每个组2个GPU。简单地说， node0有gpu0，gpu1，gpu2，gpu3 第一组: gpu0，gpu1 第2组: gpu2，gpu3 Slurm提供，但分区不是用于在节点内部分组的。如果分区不是这种情况下的，那么您能提出另一个逻辑概念吗？

浏览 1提问于2018-04-23得票数 0

回答已采纳

1回答

通用Slurm和unix格式建议

、

我正在寻找解决我所面临的问题的建议。为了提供背景，我正在尝试开发一个工具来监控我们内部的高性能计算机集群.由于我们使用slurm工作负载调度，所以我使用了它们提供的命令。我正在运行以下命令：squeue -h -t R -O Partition,NumCPUs,tres-per-node，用于告诉分配给作业的分区GPU和GPU之类的资源。但是，我们拥有的分区名称很长，这会导致将柱状输出作为一个值来处理。输出： gpu-2080ti-interacti8 gpu:1 gpu-2080ti-interacti8

浏览 4提问于2022-01-26得票数 1

回答已采纳

1回答

GPU使用率低于90% =优化不佳的游戏

、

好吧，所以不是一个“发展”问题，而是高度相关的问题。当我玩游戏时，我经常看性能数字，比如CPU的使用，GPU的使用，内存的使用等等。让我们谈谈GPU在PC上的使用。以下是我的观察:有两种游戏：最大GPU使用率:这些游戏产生60 FPS或90%+ GPU的使用。 GPU使用率差:这些游戏同时产生的FPS不足60，GPU使用率不足90%。 MAX GPU示例(试图确保我的想法被理解为ok)： 50 FPS，100% GPU 60 FPS，90% GPU 60 FPS，50% GPU (也合法) 可怜的GPU例子： 30 FPS，60% GPU (FPS限制为60) 40 FPS，50% GPU

浏览 0提问于2015-12-08得票数 1

1回答

我可以在CascadeClassifier_GPU的OpenCV上使用gpu：：for吗？

、、、、

我使用 (当前稳定版本)。我用gpu::CascadeClassifier_GPU::detectMultiScale来检测人脸。我想使用它异步与我的CUDA内核代码，我在单独的cudaStream_t启动。但是默认情况下，CascadeClassifier_GPU在默认的零流中启动，这使得在GPU上不可能启动任何对此异步的操作。正如我在这里所看到的，没有办法将gpu::Stream用于CascadeClassifier_GPU：我可以将gpu::Stream用于CascadeClassifier_GPU，以及如何使用？如果没有，那么在哪个版本的OpenCV中我可以这样做？

浏览 3提问于2014-12-17得票数 1

回答已采纳

2回答

如何在SQL中生成2D计数表？

、、、

浏览 7提问于2015-01-26得票数 1

回答已采纳

1回答

理解qsub中的-t选项

、、

关于-t选项在使用qsub提交作业时所做的工作，文档有点不清楚。从文件中： -t指定作业数组的任务ids。允许单个任务数组。array_request参数是整数id或整数范围。可以在逗号分隔列表中组合多个id或id范围。例子：-t 1-100或-t 1,10,50-100 下面是一个出错的例子，我请求了2个节点，每个节点8个进程，以及一个由16个作业组成的数组。我原本希望它能自然地分布在这两个节点上，但这16个任务却是通过两个以上的节点进行分配的。 $ echo 'hostname' | qsub -q gpu -l nodes=2:ppn=8 -t 1-16 52

浏览 0提问于2016-06-12得票数 3

回答已采纳

1回答

如何在同一台机器上的不同GPU上并行运行多个TensorFlow实例？

、、

让我们假设我并行地启动以下命令，在同一台机器上同时训练多个TensorFlow模型： python3 launch_training.py --gpu 0 python3 launch_training.py --gpu 1 python3 launch_training.py --gpu 2 python3 launch_training.py --gpu 3 python3 launch_training.py --gpu 4 python3 launch_training.py --gpu 5 python3 launch_training.py --gpu

浏览 1提问于2018-06-16得票数 2

回答已采纳

1回答

如何在我的样本输入上运行经过训练的PyTorch模型？

、、

因此，我试图执行RGBD分段，并使用git：- 但是，没有办法对我们自己的样本进行推理，所以我尝试自己定义模型并从回购程序中导入权重，下面是相同的代码 class FuseNet(nn.Module): def __init__(self, num_labels, gpu_device=0, use_class=True): super(FuseNet, self).__init__() # Load pre-trained VGG-16 weights to two separate variables. # They will be used in defini

浏览 3提问于2022-07-05得票数 0

1回答

Caffe什么时候复制数据？

// Assuming that data are on the CPU initially, and we have a blob. const Dtype* foo; Dtype* bar; foo = blob.gpu_data(); // data copied cpu->gpu. foo = blob.cpu_data(); // no data copied since both have up-to-date contents. bar = blob.mutable_gpu_data(); // no data copied. // ... some oper

浏览 2提问于2015-02-25得票数 8

回答已采纳

1回答

如何在两个GPU之间直接复制cudaArray？

、、

假设我在GPU1中有一个GPU1，在GPU2中有另一个cudaArray。使用cudaMemcpyArrayToArray标志调用cudaMemcpyDeviceToDevice实际上会导致GPU1 cudaArray通过查看分析器复制到主机内存和复制到GPU2 cudaArray的主机内存。我尝试将GPU1 cudaArray复制到GPU1全局内存，并调用cudaMemcpyPeer将其复制到GPU2全局内存，然后将其复制到GPU2 cudaArray。这比遍历主机内存要好，但仍然存在大量冗余复制。为什么没有cudaMemcpyPeerArrayToArray？如何在两个GPU之间直接

浏览 6提问于2016-02-09得票数 1

回答已采纳

2回答

将IplImage转换为CvMat

、、、、

下面是gpu surf代码： #include <iostream> #include <iomanip> #include "opencv2/contrib/contrib.hpp" #include "opencv2/objdetect/objdetect.hpp" #include "opencv2/highgui/highgui.hpp" #include "opencv2/imgproc/imgproc.hpp" #include <opencv2/imgproc/imgproc_c.h&g

浏览 0提问于2011-08-01得票数 2

回答已采纳

1回答

如何迫使tensorflow在GPU被发现后忘记它？

、

我有一个基于tensorflow的代码，我正在各种计算机上运行，有些带有CPU，还有一些带有CPU和GPU。如果计算机上有GPU，我想让用户选择使用CPU。来自的代码运行良好： import os import tensorflow as tf os.environ['CUDA_VISIBLE_DEVICES'] = '-1' if tf.test.gpu_device_name(): print('GPU found') else: print("No GPU found") # No GPU foun

浏览 3提问于2020-05-21得票数 1

回答已采纳

1回答

使用Cuda 10.2生成OpenCV 2.4xx时出错

、

我正在尝试用库达-10.2构建OpenCV 2.4，它安装在上。我跟踪了的博客帖子，以改变文件，使opencv能够找到所有的库达库。我正在运行以下命令来生成cmake缓存： cmake -DCMAKE_INSTALL_PREFIX=~/lib/opencv_2.4/installed -DCMAKE_BUILD_TYPE="Release" -DWITH_CUDA=ON -DCUDA_GENERATION=Volta -D OPENCV_DNN_CUDA=ON -DCUDA_ARCH_BIN=7.5 -DCUDA_HOST_COMPILER=/usr/bin/gcc-8 -D

浏览 7提问于2021-01-08得票数 0

回答已采纳

1回答

Tensorflow:设备序号之间不支持对等访问

、、、、

如果我有Peer access not supported between device ordinals，还可以在某种多gpu设置中运行培训吗？(据我理解，GPU“不连接”)，例如，在GPU上分别计算每个批处理，然后在CPU上合并，因为我知道这是Caffe后端以数字形式进行的“批积累”工作。原始产出： 2017-05-10 15:27:54.360688: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 1 2017

浏览 2提问于2017-05-10得票数 0

回答已采纳

1回答

为什么Tensorflow显示可用内存少于GPU规格？

、

此命令为GPU提供4614 MB内存。但是RTX2060有6 6GB的内存。为什么它只显示4 4GB多一点？ >>> tf.test.is_built_with_cuda() True >>> tf.test.is_gpu_available(cuda_only=False,min_cuda_compute_capability=None) 2019-10-29 17:02:40.062465: I tensorflow/core/platform/cpu_feature_guard.cc:142] Your CPU supports instructio

浏览 23提问于2019-10-30得票数 1

回答已采纳

1回答

在google cloud ML上运行GPU时出现错误符号日志

、、

我正在尝试使用GPU模式的google cloud ml。当我训练BASIC_GPU模式时，我有很多错误日志。但是，它在训练中效果很好。我不确定在GPU模式下学习是否很好。这是错误日志历史记录。这是print config.log_device_placement的一部分。此外，我还尝试了训练complex_model_m_gpu模式。我也有像BASIC_GPU这样的错误日志。但是，当我打印config.log_device_placement时，我看不到gpu:/1，gpu:/2，gpu:/3。我只能看到gpu:/0。重要的是，BASIC_GPU和complex_mode

浏览 2提问于2017-09-27得票数 0

1回答

从APU中强制显示，并为OpenCL提供离散GPU？

、、、

我需要一个具有以下OpenCL限制的编程系统离散GPU不能作为显卡运行->我可以从BIOS中运行。 AMD的APU的内部GPU必须用作显示GPU ->我可以从BIOS中实现 OpenCL不能识别内部APU的GPU，必须始终默认为离散的GPU 为什么我需要这个？这是因为我正在处理一个GPU代码，它要求GPU的BIOS被闪烁并安装一个定制的BIOS，这使得GPU无法显示。 AMD董事会不能启动没有VGA卡，所以我得到一个APU，有内部GPU。我正在处理的代码库无法处理冲突的GPU，所以我需要从OpenCL中禁用它(APU的GPU)。我怎么

浏览 0提问于2018-10-10得票数 1

回答已采纳

2回答

有条件地获取std::mutex

、、、

我有一个多线程应用程序，它使用GPU，它本质上是单线程的，而我使用的实际app，，在我尝试使用它们时会崩溃，所以基本上是这样的： static std::mutex s_FAST_GPU_mutex; { std::lock_guard<std::mutex> guard(s_FAST_GPU_mutex); cv::gpu::FAST_GPU(/*params*/)(/*parameters*/); } 现在，对代码进行基准测试显示，隔离的FAST_GPU()比CPU FAST()更快，但是在实际应用程序中，我的其他线程花费了大量时间等待锁，因此总体吞吐量更差。

浏览 4提问于2017-03-29得票数 1

回答已采纳

2回答

基于多gpu的Tensorflow处理性能

、、

朋友!我有一个关于使用多个gpu处理的问题。我使用了4个gpus，并尝试了简单的A^n + B^n示例，如下所示。单GPU 使用tf.device('/gpu:0')：....tf.matpow代码. 多GPU 使用tf.device('/gpu:0')：....tf.matpow代码.使用tf.device('/gpu:1')：....tf.matpow代码. 没有指定特定的gpu (我想可能所有gpu都使用了) ....just tf.matpow代码..。当尝试这样做时，结果是难以理解的。结果是: 1.单个gpu :

浏览 5提问于2017-01-10得票数 2

2回答

使用Sun Grid引擎(SGE)调度GPU资源

、、、

我们有一组机器，每台都有4个GPU。每个作业应该能够要求1-4个GPU。这里有一个问题:我想让SGE告诉每个工作，它应该采取的GPU(s)。与CPU不同的是，如果一次只有一个进程访问GPU，则GPU的工作效果最好。所以我想： Job #1 GPU: 0, 1, 3 Job #2 GPU: 2 Job #4 wait until 1-4 GPUs are avaliable 我遇到的问题是，SGE将允许我在每个节点上创建一个包含4个单元的GPU资源，但是它不会显式地告诉GPU要使用的作业(只会得到1或3，或者其他什么)。我想要创建4资源(gpu0, gpu1, gpu2, gpu3)，但

浏览 6提问于2012-05-11得票数 4

回答已采纳

7回答

Google-colaboratory:没有GPU的后端可用。

描述了如何将gpu与google-colaboratory一起使用：只需在笔记本设置中的加速器下拉菜单中选择"GPU“(通过编辑菜单或cmd/ctrl P处的命令调色板)。但是，当我在笔记本设置中选择gpu时，会看到一个弹出消息：未能为GPU可用的后端分配无后端。您想使用没有加速器的运行时吗？当我跑步时： import tensorflow as tf device_name = tf.test.gpu_device_name() if device_name != '/device:GPU:0': raise SystemError(&

浏览 11提问于2018-01-29得票数 25

回答已采纳

1回答

多个GPU角化异常加速

、

我确实实现了类似于keras ()中的多GPU代码的代码。当在带有2个GPU的服务器上运行此操作时，每个时期的培训时间如下：只显示一个GPU并设置变量gpus = 1 (只使用一个GPU)，一个时期= 32s 显示Keras两个GPU和gpus = 1，一个时代= 31 s 显示Keras两个GPU和gpus = 2，一个时代=37s 输出看起来有点奇怪，虽然初始化代码似乎会为每个GPU创建多个Tensorflow设备，但我不确定这是否是正确的行为。但我看到的大多数其他例子中，每个GPU只有一条这样的行。第一次测试(显示一个GPU，GPU= 1)： 2017-12-04

浏览 1提问于2017-12-04得票数 2

1回答

Tensorflow识别GPU，但不在设备列表中识别它们

、、、、

我已经在集群上的配置文件上安装了tensorflow-gpu版本1.15，它可以访问2个gpu。我能够通过运行 from tensorflow.python.client import device_lib device_lib.list_local_devices() 上述语句产生的本地设备列表如下： [name: "/device:CPU:0" device_type: "CPU" memory_limit: 268435456 locality { } incarnation: 17161457237421390575, name: "

浏览 5提问于2020-05-05得票数 1

回答已采纳

1回答

默认情况下，TensorFlow是否使用计算机中所有可用的GPU？

、、、

我的机器里有3个GTX Titan GPU。我用cifar10_train.py运行Cifar10中提供的示例，得到以下输出： I tensorflow/core/common_runtime/gpu/gpu_init.cc:60] cannot enable peer access from device ordinal 0 to device ordinal 1 I tensorflow/core/common_runtime/gpu/gpu_init.cc:60] cannot enable peer access from device ordinal 1 to device ordi

浏览 0提问于2016-01-17得票数 17

回答已采纳

1回答

我可以使用RDMA通过无限带加载/存储访问从GPU2核心到GPU1-RAM在不同的PCIe总线？

、、、、

如前所述：我可以从GPU0-Core访问同一个PCIe总线上的GPU1-RAM：装载/储存 cudaMemcpy() 它被命名为"NVIDIA GPUDirect v2 Peer (P2P)在同一PCIe总线上的GPU通信“(2011年)：我可以通过Infiniband使用RDMA在不同的PCIe总线上将GPU2-RAM复制到GPU1-RAM，它被命名为“GPUDirect支持，在CUDA 5(2012)中引入的。” 但是，我可以在通过Infiniband连接的PCIe总线上使用RDMA吗？加载/存储(从GPU2-Core访问GPU) cuda

浏览 4提问于2013-11-19得票数 3

回答已采纳

1回答

在CUDA上运行python代码

、、

当我试图在有300个核心的GPU系统上运行这个代码时，我在代码的开头使用了tf.device注释(‘/GPU:0’)。但发现它不在GPU上运行。然后我试着 import tensorflow as tf tf.device('/GPU:0'): # for run in GPU init = tf.initialize_all_variables() # initializing all variables sess = tf.Session( config=tf.ConfigProto(

浏览 4提问于2018-06-11得票数 2

回答已采纳

2回答

在OCaml中管理GPU内存

我想知道是否有可能为OCaml记录创建一个最终的方法？我正在创建一个GPU数据库，我使用OCaml构建DSL来查询和操作GPU数据，我需要一种方法来释放GPU内存，当它们符合GC条件(不再引用)。我已经创建了一个绑定到我的基于C的GPU来允许malloc，释放和操作GPU数据，但是当GPU内存在toplevel中不再被变量引用时，我正在寻找释放GPU内存的解决方案。 let bids = (**a 1-dim GPU array*) and asks = (**another 1-dim GPU array*) in let spread = asks - bids 在本例中，我需要为出价

浏览 0提问于2014-02-11得票数 3

回答已采纳

1回答

我是否在使用gpu进行培训？

、、、

我正在训练一个神经模型，使用keras和tensorflow作为后端。日志文件以以下消息开头： nohup: ignoring input 2019-02-12 17:44:29.414526: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 AVX512F FMA 2019-02-12 17:44:30.191565: I tensorflow/core/c

浏览 26提问于2019-02-13得票数 3

14回答

如何在tensorflow中获得当前可用的GPU？

、、

我有一个使用分布式TensorFlow的计划，我看到TensorFlow可以使用GPU进行培训和测试。在集群环境中，每台机器都可能有0或1或更多的GPU，我希望在尽可能多的计算机上将TensorFlow图运行到GPU中。我发现在运行tf.Session()时，TensorFlow在日志消息中提供了有关GPU的信息，如下所示： I tensorflow/core/common_runtime/gpu/gpu_init.cc:126] DMA: 0 I tensorflow/core/common_runtime/gpu/gpu_init.cc:136] 0: Y I tensorflo

浏览 23提问于2016-07-25得票数 227

回答已采纳

1回答

我为VM，TypeError收集铬: JSON对象必须是字符串，而不是'bytes‘

、、、、

在执行此命令后：$ autoninja -C out/Default chrome推导出此错误，如何修复？请帮帮我 [2549/55054] ACTION //gpu/config:process_json(//build/toolchain/linux:clang_x64) FAILED: gen/gpu/config/gpu_driver_bug_list_arrays_and_structs_autogen.h gen/gpu/config/gpu_driver_bug_list_autogen.cc gen/gpu/config/gpu_driver_bug_list_autogen

浏览 52提问于2021-09-26得票数 0

2回答

CUDA_VISIBLE_DEVICES与sge的结合

、、

使用sge和称为'gpu.q‘的资源复合体，可以对gpu设备(这些都是nvidia设备)进行资源管理。但是，在系统上有多个gpu设备(处于独占模式)，如果在同一个节点上分配了两个作业，用户就无法在正确的gpu上不透明地创建上下文。有人遇到这个问题了吗？我想以某种方式管理特定的gpu资源，并映射主机和设备id。 hostA -> gpu0:in_use hostA -> gpu1:free hostB -> gpu0:free hostB -> gpu1:in_use 等等。然后，根据资源请求，通过CUDA_VISIBLE_DEVICES变量显示每个主机上分配的

浏览 0提问于2012-04-05得票数 1

2回答

为什么scikit-cuda不像numpy那样广播？

、、

skcuda.misc.subtract没有像我预期的那样广播。使用以下代码： import numpy as np import pycuda.gpuarray as gpuarray import skcuda.misc as gpumisc import pycuda.autoinit a = np.ones((3, 1)) b = np.ones((1, 3)) c = a - b assert np.allclose(c, np.zeros((3, 3))) a_gpu = gpuarray.to_gpu(a) b_gpu = gpuarray.to_gpu(b) c_gpu =

浏览 2提问于2016-05-04得票数 0

1回答

如何验证GPU的使用？

如何验证CNTK是否正在使用GPU？我已经在我的机器上安装了CNTK-2-0-beta7-0-Windows64bit-GPU-1bit-SGD二进制文件。但是，当我试图从Python运行这个程序时： from cntk.device import set_default_device, gpu set_default_device(gpu(0)) 我得到： --------------------------------------------------------------------------- ValueError T

浏览 0提问于2017-01-12得票数 5

回答已采纳

1回答

当有2个GPU可用但没有具体的选择时，使用哪个GPU？

、

我有两个gpus安装在我的个人电脑，因为他们是并行使用(没有任何SLI或喜欢)。假设我在tensorflow中运行了一个简单的代码，类似于中的线性回归。那么使用哪种gpu呢？都用过了吗？这是运行日志。 2018-09-15 02:55:36.314345: I T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 2018

浏览 1提问于2018-09-14得票数 1

回答已采纳

1回答

Tensorflow GPU -设备互连，流执行器与强度1边矩阵？

、、

我有一个带有4个Nvidia K80 GPU的盒子。我正在运行Tensorflow 2。当我运行一个培训会话(tf.keras => model.fit())时，我会看到以下日志语句： I tensorflow/core/common_runtime/gpu/gpu_device.cc:1102] Device interconnect StreamExecutor with strength 1 edge matrix: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1108] 0 1 2 3 I tensorflow/

浏览 2提问于2020-06-14得票数 1

回答已采纳

1回答

Keras看到我的GPU，但在训练神经网络时不使用它

、、、

我的GPU不被Keras/TensorFlow使用。为了使我的GPU与tensorflow一起工作，我通过pip安装了tensorflow-gpu (我在Windows上使用Anaconda ) 我有nvidia 1080 print(tf.test.is_gpu_available()) True print(tf.config.experimental.list_physical_devices()) [PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'), Physica

浏览 2提问于2019-10-18得票数 7

回答已采纳

2回答

opencv make在Ubuntu上支持CUDA时失败

、、

我正在尝试在ubuntu15.10上构建支持CUDA的OpenCV。CMake显示有CUDA7.5可用。而且CMAKE是成功的。当我运行make命令时，我得到以下输出： -- Configuring done -- Generating done -- Build files have been written to: /home/jishnu/Downloads/opencv-2.4.13/Release [ 5%] Built target IlmImf [ 6%] Built target opencv_core_pch_dephelp [ 6%] Built target

浏览 0提问于2016-06-18得票数 0

4回答

GPU从CPU读取还是CPU写入到GPU？

、、

我是并行编程的初学者。我有一个问题，可能看起来很愚蠢，但当我在谷歌上搜索它时，我没有得到一个明确的答案。在GPU计算中，有一个设备，即GPU和主机，即CPU。我写了一个简单的hello world程序，它将在gpu上分配一些内存，将两个参数(例如src[]和dest[])传递给内核，将src字符串(即Hello world )复制到dest字符串，并将dest字符串从gpu获取到主机。字符串"src“是由GPU读取还是由CPU写入GPU？另外，当我们从GPU取回字符串时，是GPU写入CPU还是CPU从GPU读取？在来回传输数据时，有四种可能: 1. CPU到GPU - CPU写入

浏览 6提问于2012-07-03得票数 7

2回答

针对昂贵资源的kubernetes调度

、、、

我们有一个Kubernetes集群。现在我们想用GPU节点来扩展它(因此这将是Kubernetes集群中唯一拥有GPU的节点)。我们希望避免Kubernetes在这些节点上调度pod，除非它们需要GPU。并不是所有的管道都可以使用GPU。绝大多数仍然只占用大量CPU资源。配备GPU的服务器可能非常昂贵(例如，Nvidia DGX每台服务器可能高达150美元/k)。如果我们只是将DGX节点添加到Kubernetes集群中，那么Kubernetes也会在那里调度非GPU工作负载，这将是对资源的浪费(例如，其他调度较晚并且确实需要GPU的作业，可能会在那里耗尽其他非GPU资源，如CPU和

浏览 24提问于2018-12-20得票数 1

回答已采纳

1回答

Tensorflow 1.15后-无需安装tensorflow-gpu软件包

问题请确认在1.15 tensorflow-gpu后使用TensorFlow 的CPU和GPU，安装tensorflow软件包就足够了，并且不再需要。背景仍然可以看到声明安装tensorflow-gpu的文章，例如pip install tensorflow-gpu==2.2.0和与最新的tensorflow-GPU2.4.1一起活动。 Annaconda文档还提到了tensorflow-gpu包。 TensorFlow是一个通用的机器学习库，但最受欢迎的是深度学习应用程序。Anaconda中有三种支持tensorflow软件包的变体，其中之一是NVIDIA GPU版本。

浏览 16提问于2021-04-14得票数 3

回答已采纳

1回答

c++ AMP模板特异性限制

、、

在下面的代码中，我遇到了设计问题。我的想法是有一个数据类，它有2个嵌套类，GPU和Process。GPU包含传输到GPU的数据.然后处理，在CPU和GPU上用相同的代码处理数据。 #include <amp.h> class Data { public: template <class DataToProcess> class Process { public: Process(const DataToProcess &pp): p(pp){}; // Here is the problem ... I wa

浏览 3提问于2015-03-11得票数 1

1回答

使用GPU或CPU进行光线调整

、、、

我的机器中有1个GPU和32个GPU可用。在Ray中可以单独使用它们吗？例如，一个任务分配一个CPU，另一个任务分配一个GPU？如果我使用 tune.run(trainer_fn, num_samples=32, resources_per_trial={"GPU": 1, "CPU": 1}, ... 它只运行一列火车，因为只有一个GPU可用。我知道我可以使用类似0.1 GPU的东西，可以运行多个列车，但我没有办法知道哪个应该使用CPU，哪个应该使用GPU。

浏览 4提问于2021-12-03得票数 0

4回答

Tensorflow 1.15无法检测带有Cuda10.1的gpu

我已经安装了tensorflow 2.2.0和tensorflow 1.15.0(由pip install tensorflow-gpu==1.15.0提供)。tensorflow 2安装在Anaconda 3的基本环境中，而tensorflow 1安装在单独的环境中。 tensorflow 2.2.0可以通过简单的测试识别gpu： if tf.test.gpu_device_name(): print('Default GPU Device: {}'.format(tf.test.gpu_device_name())) //output: Default GPU

浏览 156提问于2020-06-20得票数 0

回答已采纳