腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
hadoop
流在
hdfs
上
的
数据
集中
执行
grep
、
我在
hdfs
中有一个巨大
的
数据
集,我想从中提取一些术语。同样
的
,haddop streaming命令是什么?(请看“我不想用猪”)
浏览 13
提问于2016-07-26
得票数 0
回答已采纳
1
回答
在
Hadoop
集群中为MapReduce作业部署JAR
我在CentOS linux中有一个5节点
hadoop
集群。我写了一张地图,还原并编译了这个罐子。我需要将JAR部署到哪个节点? 提前谢谢。
浏览 7
提问于2015-06-15
得票数 2
1
回答
没有输出
的
Hadoop
?
、
我最近开始学习
如何
使用
Hadoop
系统,并决定是时候尝试编写一些代码了。在此之前,我想尝试运行中
的
示例。然而,它似乎没有产生任何明显
的
结果。我目前
使用
的
是
Hadoop
版本3.3.1,
使用
的
是单节点设置,
使用
的
是JDK11.0.11。我正在Windows 10
上
运行这个(由于当前
的
开发需求)。我在cmd
上
使用
了以
浏览 5
提问于2021-12-14
得票数 0
2
回答
在
hadoop
的
映射阶段写入本地文件
、
Hadoop
将中间结果写入本地磁盘,将reducer
的
结果写入
HDFS
。
HDFS
是什么意思。它在物理上翻译成什么?
浏览 1
提问于2012-09-14
得票数 0
回答已采纳
2
回答
Hadoop
:从
HDFS
映射/还原
、
、
、
我在Apache
Hadoop
中看到
的
示例将存储在本地文件系统(例如org.apache.
hadoop
.examples.
Grep
)
上
的
文件作为输入。有没有一种方法可以加载和保存
Hadoop
文件系统(
HDFS
)
上
的
数据
?例如,我
使用
hadoop
-0.19.1/bin/
hadoop
dfs -put ~/local.x
浏览 2
提问于2009-04-24
得票数 0
回答已采纳
4
回答
Hadoop
是否为输入文件创建多个副本,每个节点一个副本
、
如果我希望将文件从本地目录复制到
HDFS
,是否需要在每个
Hadoop
节点
上
物理复制该文件?或者,如果我
使用
hadoop
dfs命令,
Hadoop
将在每个节点
上
内部创建此文件
的
副本?
浏览 1
提问于2015-09-13
得票数 1
1
回答
python +通过python脚本运行复杂
的
shell命令
、
、
我们希望通过python脚本运行以下shell命令(我们
使用
pythonVersion2.7)2.6import os os.system("echo
浏览 0
提问于2020-07-08
得票数 0
回答已采纳
1
回答
在
hadoop
mapreduce作业中
使用
多个本地文件夹作为源
、
我在多个本地文件夹中有
数据
,即/usr/bigboss/data1、/usr/bigboss/data2和更多文件夹。我想
使用
所有这些文件夹作为我
的
MapReduce命令
的
输入源,并将结果存储在
HDFS
中。我找不到一个有效
的
命令来
使用
Hadoop
Grep
示例来
执行
此操作。
浏览 2
提问于2012-05-16
得票数 0
回答已采纳
5
回答
将文件从本地复制到
hdfs
时出现错误
将文件从本地文件系统复制到
hdfs
时出现错误,我
使用
这个命令: hadoopd fs -put text.txt file
浏览 4
提问于2014-08-20
得票数 0
1
回答
bash +监视磁盘空间
的
使用
情况,并在
使用
空间达到阈值时
执行
脚本
、
、
、
、
我们希望遵循/var/
hadoop
/
hdfs
分区
的
使用
空间,如果
使用
的
空间更多地是50%,那么作为结果,我们运行脚本- do_action.bash,最后这个命令应该在crontab中,并且应该每1小时运行一次分区
hdfs
示例/dev/sdc 20G 1.7G 18G 9%
浏览 0
提问于2022-08-04
得票数 2
回答已采纳
2
回答
将
grep
结果输出到另一个目录中
的
新文件时出现
Hadoop
错误
、
、
、
我正在尝试读取几个文件
的
内容,并
使用
grep
查找与我
的
搜索查询行,然后将结果输出到另一个目录中
的
文件夹中。我得到一个错误“没有这样
的
文件或目录存在”。我已经创建了文件夹结构和文本文件。
hadoop
fs -cat /Final_Dataset/c*.txt |
grep
2015-01-* > /energydata/2015/01/01.txt-bash: /ene
浏览 8
提问于2021-10-29
得票数 0
回答已采纳
2
回答
以其他用户身份运行pig作业
、
这是一种情况,我有一个
hadoop
集群,它没有配置Kerberos安全性和工作站。
Hadoop
集群运行Cloudera CDH3发行版。群集
上
的
数据
都存储在'
hdfs
‘用户下。该工作站是linux或macos工作站,它运行一个嵌入PIG客户端
的
复杂软件。PIG客户端连接到群集以运行分析作业。 这里有一个问题。群集和工作站上
的
用户帐户不同,
hadoop
群
集中
的
所有
数据
都存储
浏览 0
提问于2012-11-02
得票数 0
回答已采纳
1
回答
不能通过管道传输两个
hadoop
命令?
、
、
我想运行以下命令:在ssh到主节点
上
之后,当我从shell调用它时,它可以工作。fs -
浏览 1
提问于2013-02-07
得票数 1
回答已采纳
1
回答
为什么火花壳-主纱-客户失败(但火花放电-主纱似乎有效)?
、
、
我正试图通过Yarn在
Hadoop
集群
上
运行星体外壳。我
使用
mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.1 -DskipTests clean package 编译工作正常,我可以运行另一件有趣
的
事情是,我可以
使用
pyspark --mast
浏览 1
提问于2014-07-07
得票数 11
2
回答
使用
copyToLocal从
HDFS
拷贝
的
路径
、
、
我正在尝试从
HDFS
复制,当我运行此命令时,什么也没有发生。
hadoop
fs -copyToLocal out1 ~/datatemp我也试过
hadoop
fs -get out1 ~/datatemp
浏览 355
提问于2018-06-08
得票数 0
3
回答
如何
在
HDFS
hadoop
中从blockName中查找文件
、
在
HDFS
中查找与给定
数据
块名称/ID
的
数据
块关联
的
文件
的
最简单方法是什么
浏览 4
提问于2012-06-04
得票数 10
回答已采纳
2
回答
使用
通配符
的
Hadoop
DistCp?
是否可以
使用
DistCp仅复制与特定模式匹配
的
文件?例如。对于/foo,我只需要*.log文件。
浏览 3
提问于2011-04-19
得票数 16
3
回答
如何
配置
Hadoop
,使每个datanode
使用
不同
的
目录?
如何
配置
Hadoop
,使每个datanode
使用
不同
的
目录进行存储? 每个datanode共享一个存储空间。我希望datanode1
使用
dir1,datanode2
使用
dir2。首先,我将所有
数据
节点配置为
使用
共享存储中
的
同一目录,结果发现只有一个datanode在运行。
浏览 2
提问于2012-10-01
得票数 1
3
回答
无法将文件写入
hdfs
-在安全模式下获取错误
hdfs
、
、
当我尝试将文件从local directory复制到
HDFS
中时,出现以下错误:[cloudera@localhost ~]$ su[root@localhost cloudera]#
hdfs
dfsadmin -safemodeSuperuser privilege is required 并进一步
执行
命令以将文件存储到<e
浏览 2
提问于2015-09-28
得票数 1
3
回答
hadoop
fs -ls只存储文件
的
路径
、
、
我正在查看
Hadoop
文件系统。用命令我将查看以dir1开头
的
每个目录,并返回它们
的
文件。我感兴趣
的
唯一信息是文件部分
的
路径。
如何
将路径仅存储到另一个文件中?理想情况下,我希望文件
的
输出仅包含该文件中
的
路径。最初,我考虑运行命令并将其输出存储到一个文件中,然后解析新文件,并
使用
regex获取路径,并将它们放入一个新文件,但这似乎
浏览 8
提问于2014-11-10
得票数 0
回答已采纳
点击加载更多
相关
资讯
Hadoop 实验-Mac 搭建篇
Hadoop及Spark 分布式HA运行环境搭建
Hadoop的配置单机模式和伪分布式介绍以及配置ssh公私钥
Kerberos和Apache Sentry干货实践(下)
Hadoop教程:功能,组件,集群和拓扑
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券