Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >安装horovod

安装horovod

作者头像
JNingWei
发布于 2020-03-17 10:04:57
发布于 2020-03-17 10:04:57
1.9K00
代码可运行
举报
文章被收录于专栏:JNing的专栏JNing的专栏
运行总次数:0
代码可运行

安装ompi

准备ompi安装包

  1. 下载ompi:https://github.com/open-mpi/ompi/releases

版本建议大于4.0.0。 因为发现openmpi-4.0.0里面没有configure,只找到config,因此我自己用的是openmpi-4.0.1.tar.gz。

  1. 把ompi压缩包上传到要安装horovod的服务器

安装ompi

  1. 我没有完全按照horovod指向的教程来,而是根据ompi的README.md做了些许修改:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 解压安装包
gunzip -c openmpi-4.0.1.tar.gz | tar xf -
cd openmpi-4.0.1

# 配置
/configure --prefix=/usr/local

# make
make -j 16
sudo make install

修改环境变量

我个人习惯在~/.bashrc里面添加:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
vim ~/.bashrc

加入如下语句:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
export PATH=/usr/local/lib/openmpi:$PATH

使新的环境变量生效:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
source ~/.bashrc

安装horovod

安装

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install horovod

Building wheel for horovod (setup.py) 这一步需要等待良久。

测试安装成功

用如下命令测试horovod是否安装成功:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import horovod.tensorflow as hvd
print(hvd.__path__)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/03/15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
安装 openmpi 4.0 用于 horovod 编译
最近编译 horovod框架过程中,需要使用openmpi 4.0但是环境中的openmpi版本比较低,所以在手动安装openmpi4.0 用于编译,下面对过程进行简要记录,进行备忘:
西湖醋鱼
2020/12/30
7810
OpenMPI - Ubuntu安装与配置
OpenMPI- Ubuntu安装与配置 OpenMPI安装 下载OpenMPI v2.0.2 解压文件,并进入文件夹,指定安装路径(默认路径:/usr/local/lib) wget https://www.open-mpi.org/software/ompi/v2.0/downloads/openmpi-2.0.2.tar.gz tar zxvf openmpi-2.0.2.tar.gz cd openmpi-2.0.2 sudo ./configure --prefix=/usr/local
AIHGF
2019/02/18
7.9K0
[源码解析] 深度学习分布式训练框架 horovod (3) --- Horovodrun背后做了什么
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。
罗西的思考
2021/06/17
3.6K0
[源码解析] 深度学习分布式训练框架 horovod (3) --- Horovodrun背后做了什么
Ubuntu - openmpi 源码安装
Ubuntu - openmpi 源码安装 sudo apt-get install openmpi # 安装版本比较低 1. Ubuntu 程序源码安装 主要包括三个步骤: 1 - ./configure  2 - make  3 - make install 这些都是典型的使用GNU的AUTOCONF和AUTOMAKE产生的程序的安装步骤。 ./configure是用来检测你的安装平台的目标特征的。比如它会检测你是不是有CC或GCC,并不是需要CC或GCC,它是个shell脚本。 m
AIHGF
2018/05/17
4.7K0
分布式深度学习最佳入门(踩坑)指南
本文主要介绍了分布式深度学习的各框架以及一些分布式深度学习训练中的常见问题,如:docker及ssh环境问题、nccl多机通信问题等。
计算机视觉
2021/01/14
3.5K0
分布式深度学习最佳入门(踩坑)指南
CONQUEST 编译安装指南 Intel 篇
  虽然笔者写过 ARM 比 Intel CPU 要有低功耗、高性能等优势,但是目前来说 Intel 芯片仍然是主流,毕竟大部分实验室所使用的服务器、工作站以及个人普通 PC 基本上都是 Intel 芯片。在 Intel 平台我们可能对于软件和依赖库的支持不需要太担心,正常来说不管 Linux 或者 Unix 系统都会有。这里笔者采用 Ubuntu Server 20.04 来举例介绍 Intel 平台下 CONQUEST 的编译安装。
zhonger
2022/10/28
1.2K0
[源码解析] 深度学习分布式训练框架 horovod (19) --- kubeflow MPI-operator
Horovod 是一款基于 AllReduce 的分布式训练框架。凭借其对 TensorFlow、PyTorch 等主流深度学习框架的支持,以及通信优化等特点,Horovod 被广泛应用于数据并行的训练中。
罗西的思考
2021/07/27
2.4K1
centos安装openmpi
通过官方网站提供的下载地址:https://download.open-mpi.org/release/open-mpi/v3.1/openmpi-3.1.0.tar.gz,下载3.1版的openmpi,在命令行执行如下命令,会将openmpi-3.1.0.tar.gz文件下载到当前目录:
俊采
2018/07/30
5.1K0
Block-1.5的编译和安装
由于CASCI/CASSCF计算量随活性空间呈指数增长,超过(16,16)的计算在高配机器上几乎不可能。近似求解大活性空间的方法通常有DMRG, selected CI等等。Block-1.5是做DMRG计算的经典程序,由Sandeep Sharma和Garnet Chan开发,虽然早在5年前就不更新了,但其计算速度仍高于很多同类程序。Block-1.5一般结合PySCF使用,可以进行DMRG-CASCI,DMRG-CASSCF和DMRG-SC-NEVPT2等计算。笔者之前在公众号上将该程序的安装拆分为几篇短文
用户7592569
2023/03/08
3.9K0
Block-1.5的编译和安装
Horovod 分布式深度学习框架相关
安装 cuda 9.0; https://www.cnblogs.com/xuyaowen/p/nvidia-driver-cuda-installation.html
西湖醋鱼
2020/12/30
6610
Horovod 分布式深度学习框架相关
[源码解析] 深度学习分布式训练框架 horovod (7) --- DistributedOptimizer
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。
罗西的思考
2021/06/29
1.5K0
业界 | 详解Horovod:Uber开源的TensorFlow分布式深度学习框架
选自Uber 作者:Alex Sergeev、Mike Del Balso 机器之心编译 参与:李泽南、路雪 Horovod 是 Uber 开源的又一个深度学习工具,它的发展吸取了 Facebook「一小时训练 ImageNet 论文」与百度 Ring Allreduce 的优点,可为用户实现分布式训练提供帮助。本文将简要介绍这一框架的特性。 近年来,深度学习引领了图像处理、语音识别和预测等方面的巨大进步。在 Uber,我们将深度学习应用到了公司业务中,从自动驾驶搜索路线到防御欺诈,深度学习让我们的数据科
机器之心
2018/05/08
3.3K0
业界 | 详解Horovod:Uber开源的TensorFlow分布式深度学习框架
CentOS6.X 安装mycli
最近发现在centos7上很容易就安装成功mycli了。但是到centos上同样的方法虽然按照提示成功了,执行mycli却报错。后来怀疑是python2.6版本过低导致的。于是就自己编译了一个python2.7 过程如下:
保持热爱奔赴山海
2019/09/18
8610
分布式训练框架Horovod初步学习
Horovod 是 TensorFlow、Keras、PyTorch 和 Apache MXNet 的分布式深度学习训练框架。Horovod 的目标是使分布式深度学习快速且易于使用。
BBuf
2020/11/09
3.3K0
[源码解析] 深度学习分布式训练框架 horovod (10) --- run on spark
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。
罗西的思考
2021/07/08
2.2K0
业界 | Facebook 开源语音识别工具包wav2letter(附实现教程)
选自GitHub 作者:Ronan Collobert等 机器之心编译 参与:李亚洲、刘晓坤 近日,Facebook AI 研究院开源了端到端语音识别系统 wav2letter,本文是该架构的论文实现,读者可据此做语音转录。 GitHub 地址:https://github.com/facebookresearch/wav2letter wav2letter wav2letter 是 Facebook AI 研究院今天开源的简单高效的端到端自动语音识别(ASR)系统。该实现的原作者包括 Ronan Col
机器之心
2018/05/11
1.7K0
python——初识python(安装pycharm和ipython)
安装编译过程需要的依赖性(进入到安装包路径下) cd /opt/ cd Python-3.6.4/ yum install gcc -y
全栈程序员站长
2022/09/27
6760
python——初识python(安装pycharm和ipython)
python2.7.8环境安装笔记
yum -y install zlib zlib-devel openssl-devel gcc python-devel
py3study
2020/01/15
6520
CentOS安装podman-compose
用wget下载python3的源码包;使用淘宝镜像,替换了官网下载python3,提高下载速度
BUG弄潮儿
2023/09/02
7640
CentOS安装podman-compose
TACO云原生最佳实践
业界AI应用中,GPU的使用逐渐增加,腾讯云TACO是一种异构计算加速软件服务,搭配腾讯自研的软硬件协同优化组件和硬件厂商特有优化方案,支持物理机、云服务器、容器等产品的计算加速、图形渲染、视频转码各个应用场景,帮助用户实现全方位全场景的降本增效。
远远小七宝
2022/12/01
1.2K0
TACO云原生最佳实践
推荐阅读
相关推荐
安装 openmpi 4.0 用于 horovod 编译
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验