Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )

【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )

作者头像
韩曙亮
发布于 2023-10-11 12:15:49
发布于 2023-10-11 12:15:49
3.8K04
代码可运行
举报
运行总次数:4
代码可运行

一、下载 Hadoop

Hadoop 发布版本在 https://hadoop.apache.org/releases.html 页面可下载 ;

当前最新版本是 3.3.6 , 点击 Binary download 下的 binary (checksum signature) 链接 ,

进入到 Hadoop 3.3.6 下载页面 :

下载地址为 :

https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

官方下载速度很慢 ;

这里提供一个 Hadoop 版本 , Hadoop 3.3.4 + winutils , CSDN 0 积分下载地址 :

https://download.csdn.net/download/han1202012/88157568

二、解压 Hadoop


解压时 , 不要直接使用 解压工具 解压 , 会报错 ;

在 " 搜索 " 中 , 搜索 cmd , 然后右键点击 命令提示符 应用 ,

此时弹出的 命令提示符 有 管理员 权限 ;

进入 Hadoop 的安装目录 D:\001_Develop\052_Hadoop ,

执行

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tar zxvf hadoop-3.3.4.tar.gz

命令 , 解压该压缩包 , 这样可以将 hadoop 完美解压出来 , 不会报错 ;

解压 Hadoop 完成后 , Hadoop 路径为

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
D:\001_Develop\052_Hadoop\hadoop-3.3.4

三、设置 Hadoop 环境变量


在 环境变量 中 , 设置

HADOOP_HOME = D:\001_Develop\052_Hadoop\hadoop-3.3.4

系统 环境变量 ;

在 Path 环境变量中 , 增加

%HADOOP_HOME%\bin %HADOOP_HOME%\sbin

环境变量 ;

四、配置 Hadoop 环境脚本


设置 D:\001_Develop\052_Hadoop\hadoop-3.3.4\etc\hadoop\hadoop-env.cmd 脚本中的 JAVA_HOME 为真实的 JDK 路径 ;

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
set JAVA_HOME=%JAVA_HOME%

修改为

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
set JAVA_HOME=D:\001_Develop\031_Java8u144_Frida\jdk1.8.0_144

注意 : 路径中不要出现空格 , 尤其是 Program Files 目录 , 不要把 JDK 安装在这个目录中 , 有大坑 ;

五、安装 winutils


将 winutils-master\hadoop-3.3.0\bin 中的 hadoop.dll 和 winutils.exe 文件拷贝到 C:\Windows\System32 目录中 ;

六、重启电脑


重启电脑 , 一定要重启 , 否则不生效 ;

七、验证 Hadoop 安装效果


然后在命令行中 , 执行

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
hadoop -version

验证 Hadoop 是否安装完成 ;

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
C:\Windows\system32>hadoop -version
java version "1.8.0_144"
Java(TM) SE Runtime Environment (build 1.8.0_144-b01)
Java HotSpot(TM) Client VM (build 25.144-b01, mixed mode)

C:\Windows\system32>hadoop
Usage: hadoop [--config confdir] [--loglevel loglevel] COMMAND
where COMMAND is one of:
  fs                   run a generic filesystem user client
  version              print the version
  jar <jar>            run a jar file
                       note: please use "yarn jar" to launch
                             YARN applications, not this command.
  checknative [-a|-h]  check native hadoop and compression libraries availability
  conftest             validate configuration XML files
  distch path:owner:group:permisson
                       distributed metadata changer
  distcp <srcurl> <desturl> copy file or directories recursively
  archive -archiveName NAME -p <parent path> <src>* <dest> create a hadoop archive
  classpath            prints the class path needed to get the
                       Hadoop jar and the required libraries
  credential           interact with credential providers
  jnipath              prints the java.library.path
  kerbname             show auth_to_local principal conversion
  kdiag                diagnose kerberos problems
  key                  manage keys via the KeyProvider
  trace                view and modify Hadoop tracing settings
  daemonlog            get/set the log level for each daemon
 or
  CLASSNAME            run the class named CLASSNAME

Most commands print help when invoked w/o parameters.

C:\Windows\system32>
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【错误记录】安装 Hadoop 运行环境报错 ( Error: JAVA_HOME is incorrectly set. Please update xxx\hadoop-env.cmd )
报错 : Error: JAVA_HOME is incorrectly set. Please update xxx\hadoop-env.cmd
韩曙亮
2023/10/11
1.3K0
【错误记录】安装 Hadoop 运行环境报错 ( Error: JAVA_HOME is incorrectly set. Please update xxx\hadoop-env.cmd )
【错误记录】PySpark 运行报错 ( Did not find winutils.exe | HADOOP_HOME and hadoop.home.dir are unset )
在 PyCharm 中 , 调用 PySpark 执行 计算任务 , 会报如下错误 :
韩曙亮
2023/10/11
1.5K0
【错误记录】PySpark 运行报错 ( Did not find winutils.exe | HADOOP_HOME and hadoop.home.dir are unset )
大数据必知必会:Hadoop(1)单机环境安装
bin目录下存放的是Hadoop相关的常用命令,比如操作HDFS的hdfs命令,以及hadoop、yarn等命令。
wux_labs
2023/02/06
6420
[Centos版]Hadoop运行环境的具体搭建过程(超详细)
操作前需要准备: 1.虚拟机镜像:CentOS-6.5-x86_64-bin-DVD1.iso 链接:https://pan.baidu.com/s/1O9a-6Sn7riGWG3mVQssTGg 提取码:rud1 2.jdk:jdk-8u144-linux-x64.tar.gz 链接:https://pan.baidu.com/s/1TdaCDaT_qriDMjbYFyphPw 提取码:qulj 3.hadoop:hadoop-2.7.2.tar.gz 链接:https://pan.baidu.com/s/1Wt0mAUHKJDSYTUM5-u6CYw 提取码:oofe 或者官网: https://archive.apache.org/dist/hadoop/common/hadoop-2.7.2/ 上述的如果百度云下载的慢的话,可以去各大开源论坛或者官网下载 博主使用的工具为Xshell,非常方便的一个软件,感兴趣的话可以动动自己的小手,去官网下载
不温卜火
2020/10/28
1.4K0
[Centos版]Hadoop运行环境的具体搭建过程(超详细)
大数据必知必会:Hadoop(2)伪分布式安装
bin目录下存放的是Hadoop相关的常用命令,比如操作HDFS的hdfs命令,以及hadoop、yarn等命令。
wux_labs
2023/02/07
5450
hadoop安装
修改workers 文件,替换localhost为当前主机节点名称,指定DataNode和NodeManager的数据节点
张云飞Vir
2022/09/29
5760
大数据必知必会:Hadoop(4)高可用集群安装
高可用集群是在多个节点上运行进程来实现Hadoop集群,并在集群中提供两个NameNode、两个ResourceManager节点。
wux_labs
2023/02/09
9701
pyspark在windows的安装和使用(超详细)
本文主要介绍在win10上如何安装和使用pyspark,并运行经典wordcount示例,以及分享在运行过程中遇到的问题。
languageX
2023/03/01
8.9K0
大数据必知必会:Hadoop(3)集群环境安装
bin目录下存放的是Hadoop相关的常用命令,比如操作HDFS的hdfs命令,以及hadoop、yarn等命令。
wux_labs
2023/02/08
9820
【错误记录】PyCharm 中安装软件包出错 ( Try to run this command from the system terminal. Make sure that you use )
在 PyCharm 中的 Python 项目中 , 使用了 PyTorch 库 , 提示
韩曙亮
2024/09/05
5840
【错误记录】PyCharm 中安装软件包出错 ( Try to run this command from the system terminal. Make sure that you use )
Windows7下安装pyspark
千万不要用默认路径Program Files,这个有空格后面会很坑!新建路径在C:\Java,Java安装在这里!
机器学习和大数据挖掘
2019/07/01
2.7K0
Windows7下安装pyspark
Hadoop安装与环境配置入门
本文所使用的系统为 Centos 8 系统,略过了系统的安装部分,使用的Hadoop版本为Hadoop v2.10.0版本。
泰坦HW
2020/07/22
1.7K0
Hadoop安装与环境配置入门
小白入门 · 腾讯云轻量服务器部署 Hadoop 3.3.6
Hadoop是一个由Apache基金会开发的开源分布式系统框架,旨在让用户能够轻松开发分布式应用程序,而无需深入了解底层的分布式细节。它能够充分利用集群计算的能力,进行高效的存储和处理大规模数据。
不惑
2024/11/15
3550
小白入门 · 腾讯云轻量服务器部署 Hadoop 3.3.6
(二)Hadoop集群配置安装
NameNode、ResourceManager、SecondaryNameNode三者分别放在三个节点上,因为都要占用内存的资源,不要重复出现在一个节点上。
wolf
2020/09/21
8590
大数据技术之_03_Hadoop学习_01_入门_大数据概论+从Hadoop框架讨论大数据生态+Hadoop运行环境搭建(开发重点)
HDFS(Hadoop Distributed File System)的架构概述,如图2-4所示。
黑泽君
2019/03/05
5810
Win10安装Hadoop3.0.0
2、将hadoop-3.0.0/bin文件复制一份,改名为hadoop-3.0.0/bin.template
静谧星空TEL
2021/04/27
6750
Win10安装Hadoop3.0.0
详解Window10下使用IDEA搭建Hadoop开发环境
经过三次重装,查阅无数资料后成功完成hadoop在win10上实现伪分布式集群,以及IDEA开发环境的搭建。一步一步跟着本文操作可以避免无数天坑。
时代疯
2021/07/22
3.6K0
Windows下搭建Spark+Hadoop开发环境
1. 下载Hadoop2.7.1版本(写Spark和Hadoop主要是用到了Yarn,因此Hadoop必须安装)
全栈程序员站长
2022/07/20
4690
【趣学程序】Hadoop安装运行
GoogleFileSystem这是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能。
趣学程序-shaofeer
2019/07/27
4200
工良出品:包教会,Hadoop、Hive 搭建部署简易教程
最近一个数据分析朋友需要学习 Hive,刚好我也想学,便利用手头的服务器搭建一个学习环境,但是搭建过程中,发现网上的教程很多过时了,而且部署过程中,很多地方走不通,博主也没有给出对应的说明。花了大力气才从各种资料中完成 Hadoop、Mysql、Hive 三者的部署。
痴者工良
2023/03/23
1.2K0
工良出品:包教会,Hadoop、Hive 搭建部署简易教程
推荐阅读
相关推荐
【错误记录】安装 Hadoop 运行环境报错 ( Error: JAVA_HOME is incorrectly set. Please update xxx\hadoop-env.cmd )
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验