前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >0691-1.4.0-GPU环境下CDSW运行TensorFlow案例

0691-1.4.0-GPU环境下CDSW运行TensorFlow案例

作者头像
Fayson
发布于 2019-08-28 08:45:24
发布于 2019-08-28 08:45:24
1.3K00
代码可运行
举报
文章被收录于专栏:Hadoop实操Hadoop实操
运行总次数:0
代码可运行

作者:李继武

文档编写目的

介绍如何在CDSW中安装集成CUDA9.2版本的tensorflow模块,以及在GPU环境下运行tensorflow案例。代码参考上一篇文章《0690-TensorFlow之车牌识别案例》,CDSW的GPU的支持与CUDA编译参考之前的文章《如何在CDSW中使用GPU运行深度学习》和《0490-如何为GPU环境编译CUDA9.2的TensorFlow1.8与1.12》。

CDSW配置

要在cdsw中运用GPU,首先需要将GPU资源交给CDSW管理

1. 打开Cloudera Manager中CDSW的配置

搜索gpu,设置以下属性:

NVIDIA_GPU_ENABLE:设为TRUE,开启CDSW对GPU的支持。

NVIDIA_LIBRARY_PATH:NVIDIA驱动程序库的完整路径。

2. 重启CDSW

3. 查看CDSW的UI界面

可以看到CDSW已经可以使用GPU资源

(上图中使用0GPU2G内存2GPU开启了一个SESSION)

定制镜像

创建一个工程之后,在容器内安装自编译的tensorflow模块时,会遇到无法安装一些依赖的问题:

因此,需要定制镜像。

1. 登录CDSW平台查看使用的基础镜像名称

点击“Admin”

点击“engine”,查看基础镜像名称

上图标注部分即为CDSW的基础镜像(docker.repository.cloudera/cdsw/engine:5)由Docker的Repository和Tag组成。

2. 命令行查看CDSW基础镜像:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo docker images

3. 使用下面命令启动容器

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo docker run -it --network='host' docker.repository.cloudera.com/cdsw/engine:5 /bin/bash

4. 安装模块

将tensorflow安装包及相关依赖包从宿主机中拉取到容器内:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
scp -r root@ip:/root/tensorflow-1.8.0 .

查看tensorflow-1.8.0中的内容如下,包含tensorflow模块安装包及相关依赖包,以及案例中需要用到的image模块。

各依赖包的安装顺序,已经整理在了两个脚本之中,如上图中的install_tensorflow_1_8.sh以及install_image.sh中,直接运行这两个脚本即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sh install_tensorflow_1_8.sh
sh install_image.sh

脚本如下:

install_tensorflow_1.8.sh:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#!/bin/bash
yum -y install python-pip
rpm -ivh ./python-wheel-0.24.0-2.el7.noarch.rpm
cd html5lib-0.9999999
python setup.py install
cd ../termcolor-1.1.0
python setup.py install
cd ../gast-0.2.0
python setup.py install
cd ../
pip install pbr-5.1.1-py2.py3-none-any.whl
pip install Werkzeug-0.14.1-py2.py3-none-any.whl
pip install astor-0.7.1-py2.py3-none-any.whl
pip install enum34-1.1.6-py2-none-any.whl
cd absl-py-0.6.1
python setup.py install
cd ../
pip install backports.weakref-1.0.post1-py2.py3-none-any.whl
pip install bleach-1.5.0-py2.py3-none-any.whl
pip install funcsigs-1.0.2-py2.py3-none-any.whl
pip install futures-3.2.0-py2-none-any.whl
pip install grpcio-1.17.1-cp27-cp27mu-manylinux1_x86_64.whl
pip install Markdown-3.0.1-py2.py3-none-any.whl
pip install mock-2.0.0-py2.py3-none-any.whl
pip install numpy-1.15.4-cp27-cp27mu-manylinux1_x86_64.whl
pip install protobuf-3.6.1-cp27-cp27mu-manylinux1_x86_64.whl
pip install six-1.12.0-py2.py3-none-any.whl
pip install tensorboard-1.8.0-py2-none-any.whl
pip install tensorflow-1.8.0-cp27-none-linux_x86_64.whl

install_image.sh

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#!/bin/bash
pip install Pillow-5.4.1-cp27-cp27mu-manylinux1_x86_64.whl
pip install pytz-2018.9-py2.py3-none-any.whl
pip install Django-1.11.18-py2.py3-none-any.whl
pip install image-1.5.27-py2.py3-none-any.whl

5. 导入驱动依赖库

GPU版的tensorflow在使用时需要导入驱动相关的依赖包,比如libcuda.so.1,libcusovel.so.9.2等,因此,需要将宿主机中相关的库拉取到容器当中,拉取的依赖有两个,一是/usr/local/cuda9.2/lib64,二是/usr/lib64/nvidia

先拉取/usr/local/cuda9.2

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
scp -r root@ip:/usr/local/cuda9.2  /usr/local

当CDSW启动容器时,容器中的LD_LIBRARY_PATH默认包含/usr/local/cuda/lib64,因此,此处做一个软连接:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ln -s /usr/local/cuda9.2  /usr/local/cuda

再将/usr/lib64/nvidia下的文件全部拉取也放在/usr/local/cuda/lib64下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
scp -r root@ip:/usr/lib64/nvidia/*  /usr/local/cuda/lib64/

6. 保存镜像

此时不要退出上述打开的镜像,再开一个连接窗口,连接到宿主机,使用下面命令查看:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker ps | more

记住这个container ID

再使用下面命令保存容器为新的镜像:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker commit containerId repository:tag

至此,镜像已经定制完成,可在CDSW使用该镜像来启动容器了。

配置定制镜像

1. 登录CDSW平台,点击“Admin”

点击“engine”,在下图中位置添加定制的镜像

验证镜像

1. 打开一个session

点击“configure”,选择自定制的镜像:

返回上一步,选择python2,以及资源中加选2GPU。

点击“launce Session”,启动session。

2. 上传案例代码及数据集。

3. 在交互窗口使用下面命令运行案例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-province.py train

可以看到,正常训练完成

使用下方的命令进行预测:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-province.py predict

从上述结果可以看出,可以正常运行,并且已正常识别出GPU,从下面的GPU使用率中,可以看到tensorflow调用了GPU进行运算:

训练城市代号:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-letters.py train

预测城市:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-letters.py predict

训练车牌编号:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-digits.py train

预测车牌编号:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!python train-license-digits.py predict

从上述预测结果来看,预测准确。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
docker︱在nvidia-docker中使用tensorflow-gpu/jupyter
本文介绍了如何在深度学习中利用Docker和NVIDIA GPU进行高效的GPU加速计算,同时探讨了如何安装和配置Docker和NVIDIA GPU驱动,以及如何使用Docker和TensorFlow进行GPU加速的深度学习模型训练。
悟乙己
2018/01/02
4.9K0
docker︱在nvidia-docker中使用tensorflow-gpu/jupyter
TensorFlow 入门指南
但在开始之前,先来看看一个最简单的使用 TensorFlow Python API 的示例代码,这样你就会对我们接下来要做的事情有所了解。
竹清
2018/08/31
1.4K0
TensorFlow 入门指南
TensorFlow下载与安装
TensorFlow简介 TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。 TensorFlow可被用于语音识别或图像识别等多项机器深度学习领域,对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在
xiangzhihong
2018/02/08
2K0
TensorFlow下载与安装
tensorflow0.10.0升级到tensorflow.011.0
(3). 安装cuda8.0, 已有的不需要安装 官网下载cuda8.0,网速慢的话
ke1th
2019/05/26
8420
【TensorFlow实战——笔记】第3章:TensorFlow第一步_TensorFlow的编译及安装
不管哪种情况,我们都推荐使用Anaconda作为Python的环境,因为可以避免大量的兼容性问题。
石瞳禅
2018/09/18
8160
【TensorFlow实战——笔记】第3章:TensorFlow第一步_TensorFlow的编译及安装
双显卡笔记本安装CUDA+theano、tensorflow环境
原文出处:http://www.cnblogs.com/jacklu/p/6377820.html
用户7043923
2020/03/12
8610
我的AI之路 —— 从裸机搭建GPU版本的深度学习环境
服务器是阿里云的CentOS7.4,默认的时候选择的CUDA驱动选错了,1.5以上的tensorflow都应该选择CUDA9.0,注意不要太高,也不要太低!TF很挑剔!
用户1154259
2018/08/09
9850
我的AI之路 —— 从裸机搭建GPU版本的深度学习环境
为stackGan一个工程创建一个虚拟环境,python 2.7 tensorflow0.12-tensorflow 1.01
安装conda 下载地址:https://repo.continuum.io/miniconda/Miniconda2-latest-Linux-x86_64.sh 下载完成后执行: bash Miniconda2-latest-Linux-x86_64.sh 安装地址:xlz/Miniconda 刷新一下配置文件:source /home/xlz/.bashrc #这里是管理员权限吼 创建实验环境:conda create -n stackGan python=2.7 #我们创建一个虚拟2.7环
水球喵子
2018/04/10
1.1K0
为stackGan一个工程创建一个虚拟环境,python 2.7 tensorflow0.12-tensorflow 1.01
Ubuntu18.04完美搭建Tensorflow-gpu
Persist in sharing and promote mutual progress
公众号guangcity
2019/09/20
3.3K0
Ubuntu18.04完美搭建Tensorflow-gpu
0490-如何为GPU环境编译CUDA9.2的TensorFlow1.8与1.12
从CDSW1.1.0开始支持GPU,具体可以参考Fayson之前的文章《如何在CDSW中使用GPU运行深度学习》,从最新的CDSW支持GPU的网站上我们可以查到相应的Nvidia Drive版本,CUDA版本以及TensorFlow版本,如下:
Fayson
2019/01/02
3.7K1
原 荐 Docker中使用GPU
GPU驱动安装 使用GPU之前,需要先确定好CUDA已经安装配置完成。 查看是否支持GPU lspci | grep -i nvidia 01:00.0 VGA compatible contr
霡霂
2018/06/04
2.9K0
每日一学——TensorFlow的学习
什么是TensorFlow? TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU)、服务器、移动设备等等。TensorFlow 最初由Google Brain 小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深
计算机视觉研究院
2018/04/17
1.4K0
每日一学——TensorFlow的学习
TensorFlow开发环境搭建(Ubuntu16.04+GPU+TensorFlow源码编译)
作者:刘才权 编辑:田 旭 安装平台 1 平台 目前TensorFlow已支持Mac、Ubuntu和Windows三个主流平台(64位平台), 2 GPU vs CPU 在安装时可以选择安装版本是否
机器学习算法工程师
2018/03/06
1.8K0
TensorFlow开发环境搭建(Ubuntu16.04+GPU+TensorFlow源码编译)
Linux下Caffe、Docker、Tensorflow、PyTorch环境搭建(CentOS 7)
本文介绍了如何在CentOS 7上安装NVIDIA CUDA工具包以及CUDNN,并使用Docker和Nvidia-Docker来安装深度学习环境。通过这些环境,可以方便地运行深度学习模型的训练、测试和部署。
Tyan
2017/12/28
3.2K1
Linux下Caffe、Docker、Tensorflow、PyTorch环境搭建(CentOS 7)
Ubuntu17.04安装TensorFlow1.2的GPU版本
本文介绍了在Ubuntu 17.04系统上安装TensorFlow 1.2的GPU版本的过程,包括安装NVIDIA的GPU-CUDA, cuDNN, libcupti-dev, 以及通过pip或spip安装TensorFlow-GPU版本。
王小雷
2018/01/02
1.4K0
Ubuntu17.04安装TensorFlow1.2的GPU版本
手把手教你安装深度学习软件环境(附代码)
来源:机器之心 本文长度为2800字,建议阅读5分钟。 本文向你解释如何在一台新装的 Ubuntu 机器上安装 Python 和 Nvidia 硬件驱动、各类库和软件包。 为了进行强化学习研究,我最近购置了一台基于 Ubuntu 和英伟达 GPU 的深度学习机器。尽管目前在网络中能找到一些环境部署指南,但目前仍然没有全面的安装说明。另外,我也不得不阅读了很多文档来试图理解安装细节——其中的一些并不完整,甚至包含语法错误。因此,本文试图解决这个问题,提供一个详尽的软件环境安装指南。 本文将指导你安装 操作
数据派THU
2018/01/30
1.5K0
手把手教你安装深度学习软件环境(附代码)
TensorFlow学习笔记:1、TensorFlow快速下载与安装
本文介绍了如何在CentOS系统上安装TensorFlow。首先介绍了TensorFlow的基本概念,然后提供了详细的安装步骤。最后,通过验证安装来确认是否成功安装。在文章中还提到了一些常见的安装问题以及解决方法。
程裕强
2018/01/02
1.2K0
从零开始:手把手教你安装深度学习操作系统、驱动和各种python库!
为了研究强化学习,最近购置了一台基于 Ubuntu 和英伟达 GPU 的深度学习机器。尽管目前在网络中能找到一些环境部署指南,但目前仍然没有全面的安装说明。另外,我也不得不阅读了很多文档来试图理解安装细节——其中的一些并不完整,甚至包含语法错误。本文试图提供一个详尽的软件环境安装指南。 操作系统(Ubuntu) 4 种驱动和库(GPU 驱动、CUDA、cuDNN 和 pip) 5 种 Python 深度学习库(TensorFlow、Theano、CNTK、Keras 和 PyTorch) 这些软件之间的互
IT派
2018/03/28
1.8K0
从零开始:手把手教你安装深度学习操作系统、驱动和各种python库!
算法工程师必会:Dockerfile 语法与Dockerfile模板
RUN apt install -y openssh-server RUN mkdir -p /var/run/sshd RUN mkdir root/.ssh
AI拉呱
2021/01/14
1.1K0
深度学习GPU环境Ubuntu16.04+GTX1080+CUDA9+cuDNN7+TensorFlow1.6环境配置
本节详细说明一下深度学习环境配置,Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6。 Python 3.6 首先安装 Python 3.6,这里使用 Anaconda 3 来安装,下载地址:https://www.anaconda.com/download/#linux,点击 Download 按钮下载即可,这里下载的是 Anaconda 3-5.1 版本,如果下载速度过慢可以选择使用清华
崔庆才
2018/04/08
2.1K0
深度学习GPU环境Ubuntu16.04+GTX1080+CUDA9+cuDNN7+TensorFlow1.6环境配置
推荐阅读
相关推荐
docker︱在nvidia-docker中使用tensorflow-gpu/jupyter
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验