hadoop数据区目录_Hadoop -输入目录问题_Hadoop，不同卷上的目录 - 腾讯云开发者社区

、、、、

我有一个oozie工作流程，它做了一个坚果爬行，我设计使用色调。除了索引到solr之外，流程中的所有步骤都有效。定义solrindex的oozie操作如下所示 ` <start to="solr-test"/> <action name="solr-test"> <java> <job-tracker>${jobTracker}</job-tracker> <name-node>${nameNode}</nam

浏览 1提问于2014-05-23得票数 0

2回答

未添加Apache hive MSCK修复表新分区

、、、

我是Apache Hive的新手。在处理外部表分区时，如果我直接将新分区添加到HDFS，则在运行MSCK修复表后不会添加新分区。下面是我尝试过的代码。 --创建外部表 hive> create external table factory(name string, empid int, age int) partitioned by(region string) > row format delimited fields terminated by ','; --详细的表格信息 Location: hdfs://localhost.localdoma

浏览 16提问于2015-08-03得票数 7

2回答

在Apache钻头上为HDFS制作存储插件

、、、、

我正在尝试为Hadoop (hdfs)和Apache制作存储插件。实际上，我很困惑，我不知道应该为hdfs:// connection设置什么端口，以及设置什么位置。这是我的插件： { "type": "file", "enabled": true, "connection": "hdfs://localhost:54310", "workspaces": { "root": { "location": "/", "writ

浏览 4提问于2016-08-31得票数 0

回答已采纳

4回答

无法在单元格中创建表从HDFS读取CSV

、、

在通过从HDFS读取.csv文件在Hive中创建表时，我遇到了问题。查询如下： CREATE EXTERNAL TABLE testmail (memberId String , email String, sentdate String,actiontype String, actiondate String, campaignid String,campaignname String) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LOCATION '/user/hadoop/cloudera/ameeth/ca_em

浏览 4提问于2014-09-23得票数 8

回答已采纳

3回答

无法为s3ablock-0001找到任何有效的本地目录-

、、、

当我试图在S3上编写数据时，我在亚马逊电子病历上运行乔布斯面临着一个问题。这是堆栈跟踪： org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directory for s3ablock-0001- at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.getLocalPathForWrite(LocalDirAllocator.java:463) at org.apache.hadoop

浏览 31提问于2020-10-13得票数 3

3回答

无法将数据导入/加载到配置单元，为什么？

、、、

我正在尝试导入数据(包含两列的简单文件，int和string)，表格外观： hive> describe test; id int name string 当我尝试导入时： hive> load data inpath '/user/test.txt' overwrite into table test; Loading data to table default.test rmr: org.apache.hadoop.security.AccessControlException: Permission denied: user=hadoop, a

浏览 7提问于2012-10-09得票数 2

1回答

关于Hadoop、Hive和Presto的问题

、、

我正在研究使用Hadoop集群上的Hive，然后使用Presto对Hadoop中存储的数据进行一些分析，但我仍然对一些事情感到困惑：文件存储在Hadoop (某种文件管理器)中。 Hive需要表来存储来自Hadoop (数据管理器) 的数据。 Hadoop和Hive是分开存储数据还是Hive仅仅使用Hadoop中的文件？(在硬盘空间等方面？) ->是这样的，Hive是在表中从Hadoop中导入数据，而不使用Hadoop，或者我必须如何看待这一点？ Presto可以不用蜂巢直接在Hadoop上使用吗？先谢谢你回答我的问题:)

浏览 3提问于2014-01-24得票数 1

回答已采纳

4回答

从Hadoop到S3的distcp失败，并显示“在任何本地目录中都没有可用的空间”。

、、

我正在尝试使用distcp将数据从本地hadoop集群复制到S3存储桶中。有时它“工作”，但一些映射器失败，堆栈跟踪如下。其他时候，太多的映射器失败，导致整个作业取消。错误“在任何本地目录中都没有可用的空间”。对我来说没什么意义。边缘节点(运行distcp命令的位置)、集群和S3存储桶上都有足够的空间。有谁能解释一下这件事吗？ 16/06/16 15:48:08 INFO mapreduce.Job: The url to track the job: <url> 16/06/16 15:48:08 INFO tools.DistCp: DistCp job-id: job_

浏览 0提问于2016-06-17得票数 3

2回答

如何查看hadoop数据目录结构？

、、

我在蜂巢里把桌子隔开了。所以我想看看hadoop中的目录结构？在中，我发现了以下命令 hadoop fs -ls /app/hadoop/tmp/dfs/data/ /app/hadoop/tmp/dfs/data/是我的数据路径。但是这个命令返回 ls:无法访问/app/hadoop/tmp/dfs/data/:没有这样的文件或目录。我是不是漏掉了什么？

浏览 16提问于2013-01-28得票数 0

回答已采纳

1回答

hadoop奴隶可以存在于不同的安装目录中吗？

、

我有一个包含一个namenode和两个数据节点的3节点hadoop集群。namenode驻留在：/opt/hadoop/目录中，datanodes位于/mnt/hadoop/目录中。在namenode的.bashrc中是： export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::") export HADOOP_INSTALL=/opt/hadoop export PATH=$PATH:$HADOOP_INSTALL/bin export PATH=$PATH:$HADOOP_INSTALL/sbin e

浏览 1提问于2014-11-12得票数 1

回答已采纳

1回答

hadoop存储目录使用的空间大于HDFS上的总数据。

、、

我有一个具有复制因子= 3的三节点hadoop集群。每个系统的/app/hadoop/tmp/dfs/是存储目录。每个数据节点系统的硬盘容量为221 of。 HDFS的有效数据为62 of，replication 62*3= 186 of。现在的问题是，尽管660 GB集群上只有186 GB的数据，但我仍然缺乏存储空间: HDFS显示了在可用空间上的巨大差异： datanode1 =7.47GB datanode2 =17.7GB datanode3 =143 GB 为了确保hadoop本地存储使用这些空间，我在每个datanode上运行了这个命令。对于datanode1 du -h -

浏览 6提问于2012-09-18得票数 1

1回答

试图将数据存储到hdfs文件中时出错

、、、

我在用Ubuntu 当我试图将数据存储到HDFS (Spark )时： processed.write.format("json").save("hdfs://localhost:54310/mydata/enedis/POC/processed.json") 我犯了这个错误原因: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException)：权限被拒绝: user=root，access=WRITE，inode="/mydata/en

浏览 5提问于2020-05-03得票数 2

回答已采纳

2回答

如何在windows下构建hadoop源代码？

、、、

试图从windows 7 x64下的源代码构建hadoop。按照指示和我将hadoop源代码从中克隆出来，签出到origin/branch-2.5 (SHA-1: fa3bb675a728105d69614f53abe4339958550adf)，然后从运行的windows控制台： set Platform=x64 clean install -Pdist,native-win -DskipTests -Dtar 并得到错误- [ERROR] Failed to execute goal org.apache.hadoop:hadoop-maven-plugins:2.5.0

浏览 5提问于2014-10-10得票数 5

1回答

如何在Ubuntu14.04上完全卸载eclipse

我在Ubuntu14.04 for hadoop程序上安装了eclipse，hadoop插件总是有一些问题。因此，我安装和卸载eclipse两次。但我不确定它是否被完全移除了。上次我从Ubuntu软件中心安装eclipse的时候。我单击软件中心中的uninstall按钮，然后删除文件夹/usr/lib/ eclipse (安装eclipse的位置)。但我也在/etc中找到了'eclipse.ini‘，我可以删除这个文件吗？为了完全移除eclipse，我还能做些什么呢？

浏览 13提问于2015-05-18得票数 1

1回答

多个Datanode目录写入操作

iam使用hadoop apache 2.7.1，我已经将数据节点目录配置为具有多个目录 <property> <name>dfs.data.dir</name> <value>/opt/hadoop/data_dir,file:///hdd/data_dir/</value> <final>true</final> </property> 根据此配置，应在/opt/

浏览 0提问于2017-08-15得票数 0

3回答

hadoop引发无法找到或加载主类org.apache.hadoop.mapreduce.v2.app.MRAppMaster。

、、

当我运行distcp将数据从s3移动到本地hdfs时，在为复制数据而启动的map还原作业期间会得到此异常： Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster 我检查了所有可能的在线文章。我的yarn-site.xml文件包含对于集群的每个节点，我检查并设置了这些变量并指向正确的文件夹，实际上，<property> <name>yarn.application.classpath</name> <

浏览 3提问于2015-08-13得票数 0

1回答

Mapreduce (缓冲区内存)中的中间数据溢出

、、

我在Hadoop2.6.0中运行了一个字数统计作业，我发现map输出有几处溢出。我有以下配置： mapreduce.task.io.sort.mb = 100 mapreduce.map.sort.spill.percent = 0.80 运行作业后，映射输出字节= 222660096。通过查看下面的容器日志，似乎缓冲区大小几乎是31055173字节，而不是100MB。在将第一个溢出溢出到磁盘bufstart = 0; bufend = 31055173; bufvoid = 104857600之前，请查看参数值并且通过将以字节为单位的Map输出除以bufend (222660096/3

浏览 0提问于2016-03-09得票数 5

1回答

如何使用spark在HDFS中保存数据？

、、、

我想使用Spark Streaming从Kafka中检索数据。现在，我想将我的数据保存在远程HDFS中。我知道我必须使用函数saveAsText。但是，我并不确切地知道如何指定路径。如果我这样写，对吗？ myDStream.foreachRDD(frm->{ frm.saveAsTextFile("hdfs://ip_addr:9000//home/hadoop/datanode/myNewFolder"); }); 其中ip_addr是我的hdfs远程服务器的ip地址。hadoop是我在安装DataNode时创建的hadoop目录(我不知道是否必须指定这个目录

浏览 7提问于2017-01-31得票数 3

回答已采纳

13回答

单元执行错误，从org.apache.hadoop.hive.ql.exec.DDLTask返回代码1

在创建蜂巢数据库时，我会收到以下错误失败:执行错误，从org.apache.hadoop.hive.ql.exec.DDLTask返回代码1。com/facebook/com 303/FacebookService$Iface Hadoop version:**hadoop-1.2.1** HIVE Version: **hive-0.12.0** Hadoop路径：/home/hadoop_test/data/hadoop-1.2.1 蜂巢路径:/home/hadoop_test/data/hive-0.12.0 我将hive*.jar、jline-..jar、antlr-runt

浏览 0提问于2014-04-28得票数 27

2回答

读取大型mongodb数据

、、、

我有一个java应用程序，它需要从MongoDB 3.2中读取大量数据并将其传输到Hadoop。此批处理应用程序每4小时运行一次，每天6次。数据规范：文件:每次80000份(每4小时一次) 尺寸: 3gb 目前，我正在使用MongoTemplate和Morphia来访问MongoDB。但是，在使用以下方法处理这些数据时，我会得到OOM异常： List<MYClass> datalist = datasource.getCollection("mycollection").find().asList(); 读取这些数据并填充到Hadoop的最佳方

浏览 2提问于2017-09-28得票数 7

回答已采纳

1回答

cloudera vm oozieWorkflow java.lang.ClassNotFoundException

、、、、

我是Hadoop的新手，我有一个流动的问题：当我试图运行我的工作流程时，我总是得到一个"java.lang.ClassNotFoundException“。我使用Cloudera快速启动VM v4.5。已使用的oozzie设置： Jar名称: sample.jar 主要课程:司机参数:in_单项/ out 用过的java类 public class Driver{ public static class TokenizerMapper extends Mapper<Object, Text, Text, Text> { @Override

浏览 0提问于2014-01-28得票数 0

回答已采纳

2回答

hadoop文件系统的说明

有人能帮我理解hadoop的数据存储概念吗？据我所知，hadoop处理fs图像和数据块，fsimage和编辑日志路径存储hdfs-site.xml。但是数据块呢？有人能帮我吗？我有点困惑/user和/tmp dir实际上在文件系统中的位置。我使用这个链接来建立一个单节点hadoop集群：

浏览 1提问于2014-02-15得票数 0

回答已采纳

1回答

在EMR上使用PIG MongoDB-Hadoop连接器时出现"ERROR 6000，Output location validation failed“

、、、、

在EMR上的pig脚本中，我得到了一个“输出位置验证失败”异常。将数据保存回S3时失败。我使用这个简单的脚本来缩小问题的范围： REGISTER /home/hadoop/lib/mongo-java-driver-2.13.0.jar REGISTER /home/hadoop/lib/mongo-hadoop-core-1.3.2.jar REGISTER /home/hadoop/lib/mongo-hadoop-pig-1.3.2.jar example = LOAD 's3://xxx/example-full.bson' USING com.

浏览 2提问于2015-03-24得票数 2

2回答

名称节点和Datanode未启动。

、、

我在Ubuntu中安装了hadoop，并为namenode和数据节点创建了dir。但是我无法看到名称节点和数据节点正在运行。 hduser@sanjeebpanda:/usr/local/hadoop/etc/hadoop$ jps 9445 Jps 5311 JobHistoryServer hduser@sanjeebpanda:/usr/local/hadoop/etc/hadoop$ start-all.sh This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh 14/11/09 21:14:34 W

浏览 2提问于2014-11-10得票数 0

回答已采纳

1回答

org.apache.hadoop.hdfs.server.common.InconsistentFSStateException:目录/tmp/hadoop/dfs/名称处于不一致状态

我运行的是单节点。NameNode总是在启动群集时开始失败。我得到了下面的错误。 2013-06-29 10:37:29,968 FATAL org.apache.hadoop.hdfs.server.namenode.NameNode: Exception in namenode join org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /tmp/hadoop/dfs/name is in an inconsistent state: storage directory does

浏览 0提问于2013-06-29得票数 4

1回答

如何使用特定的用户将星火外壳保存到hdfs中

、、、

使用intellijCommand的im使用ubuntuim使用火花依赖关系，没有找到，但是可以安装：..(当我在shell中输入火花时)，我有两个用户胺，和hadoop_amine (在其中设置了hadoop ) 当我试图将数据存储到HDFS (spark )时： procesed.write.format("json").save("hdfs://localhost:54310/mydata/enedis/POC/processed.json") 我犯了这个错误 Caused by: org.apache.hadoop.ipc.RemoteException

浏览 2提问于2020-05-03得票数 0

回答已采纳

2回答

典型的配置单元和Hadoop磁盘空间使用情况

、

我们有两台服务器的Hadoop/Hive集群，每台服务器上的Hive数据库使用约160 We的磁盘空间，但Hadoop数据目录约为850 We。是否正常，Hive数据库大小与Hadoop数据目录大小的典型比率是多少？

浏览 0提问于2014-09-29得票数 0

1回答

在服务器java.io.IOException上更改IP后: replica.getGenerationStamp()

、

我正在使用flume将数据加载到HDFS。最近服务器上的IP发生了变化，所以在那之后我根本就不能启动从服务器了。我在服务器和数据节点上有很多数据，所以不能重新格式化。即使主节点调用从节点并尝试启动，从节点也不会启动。下面是我看到的一个例外，因为slave还在尝试引用master的旧IP： java.io.IOException: replica.getGenerationStamp() < block.getGenerationStamp() WARN org.apache.hadoop.hdfs.server.protocol.InterDatanodeProtocol: Failed

浏览 0提问于2014-12-15得票数 0

1回答

Hadoop 2.6.1单节点设置:数据节点未启动

、

我尝试根据的说明设置Hadoop2.6.1 但是我的数据节点没有启动。当我做JPS时，我只得到下面的过程 ▶ jps 8406 ResourceManager 7744 NameNode 8527 NodeManager 8074 SecondaryNameNode 9121 Jps DataNode日志： 2015-10-07 13:02:24,144 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Invalid dfs.datanode.data.dir /home/vinod/.hadoopdata/hdfs/datanode

浏览 1提问于2015-10-07得票数 0

2回答

将正确的Java版本与Hadoop通信

、、

我基本上有问题，只是当我转到安装hadoop的文件夹时，没有hadoop/config，所以我不知道在哪里查找hadoop-env.sh。我如何才能让Hadoop找到我的最新数据Java，而不是我的强制性OSX遗留Java？

浏览 1提问于2016-04-24得票数 0

回答已采纳

1回答

Hadoop 2.9.0 datanode未运行

、、

在执行以下命令时，我将按照教程设置Hadoop-2.9.0： sbin/start-df.sh 我在终端上得到以下输出： Starting namenodes on [localhost] localhost: starting namenode, logging to /home/uname/hadoop-2.9.0/logs/hadoop-uname-namenode-mname.out localhost: starting datanode, logging to /home/uname/hadoop-2.9.0/logs/hadoop-uname-datanode-mname.out

浏览 2提问于2018-02-18得票数 2

1回答

在Ambari中，如果datanode.data.dir中没有提到来自的目录，则会在根驱动器上创建它

、

我有3个数据节点A、B、C。A和B包含3个硬盘驱动器，安装为 /hadoop/data1 /hadoop/data2 /hadoop/data3 在C节点中，我只装载了2个驱动器 /hadoop/data1 /hadoop/data2 我已经安装了HDFS和 datanode.data.dir = /hadoop/data1,/hadoop/data2,/hadoop/data3 Ambari安装说明不存在的数据目录将被忽略。但在我的示例中，在节点C的根驱动器下创建了一个新文件夹(/hadoop/data3)。我怎样才能让它忽略不存在的目录？

浏览 6提问于2019-01-23得票数 0

1回答

引号中的Sqoop导入表参数失败

、、、、

我试图导入数据从SAP数据库到hadoop使用sqoop导入命令，但它失败了，给出的表名如"hadoop::Poc.Emp“。HANA区分大小写，因此表名应该在"“中。 sqoop import --connect "jdbc:localhost --username user --password pass --table "hadoop::Poc.Emp" Execute getColumnInfoRawQuery : **SELECT t.* FROM hadoop::Poc.Emp AS t WHERE 1=0** sql syntax err

浏览 0提问于2018-07-06得票数 0

3回答

Hadoop缺少HDFS中存在的输入

晚上好，我尝试在Hadoop mapreduce上运行训练样本，但收到输入路径不存在的错误。 16/09/26 05:56:45 ERROR streaming.StreamJob: Error Launching job : Input path does not exist: hdfs://bigtop1.vagrant:8020/training 但是，查看hdfs目录，可以清楚地看到"training“文件夹。 [vagrant@bigtop1 code]$ hadoop fs -ls Found 3 items drwx------ - vagrant hadoop

浏览 40提问于2016-09-26得票数 1

回答已采纳

1回答

"sudo hadoop：“是做什么的？

、、

我看到了在hadoop安装过程中使用的在线发布的以下脚本。 sudo tar xzf hadoop-0.20.2.tar.gz sudo mv hadoop-0.20.2 hadoop sudo chown -R hadoop:hadoop hadoop 我不太明白。什么是 sudo chown -R hadoop:hadoop hadoop 在这里做吗？谢谢你的解释。

浏览 0提问于2011-06-24得票数 2

回答已采纳

5回答

Hive如何存储数据(从HDFS加载)？

、、、、

我对Hadoop (HDFS和Hbase)和Hadoop生态系统(Hive，Pig，Impala等)相当陌生。我对Hadoop组件(如NamedNode、DataNode、Job、Tracker )有很好的理解，以及它们如何协同工作，以高效的方式存储数据。在试图理解数据访问层(如Hive )的基本原理时，我需要了解表的数据(在Hive中创建)究竟存储在哪里？我们可以在Hive中创建外部和内部表。由于外部表可以在HDFS或任何其他文件系统中，因此Hive不将此类表的数据存储在仓库中。内部桌子呢？此表将作为Hadoop集群上的一个数据节点上的目录创建。一旦我们从本地或HDFS文件系统中加载这些表

浏览 11提问于2015-10-28得票数 4

1回答

不能操作Eclipse中的"Run on Hadoop“选项

、、

我安装了Hadoop -0.20.2(单节点)，并在Linux(Centos).I上进行了配置，为Hadoop安装了Eclipse并添加了Eclipse-plugin。我将数据集放在/home/Hadoop/input/ali.txt中。我无法在Eclipse中的Hadoop上运行Wordcount示例。当我选择“在Hadoop上运行”选项时，没有发生什么事情。另外，在Eclipse中作为java应用程序运行Wordcount示例时，会遇到以下错误： Input path does not exist: file:/home/hadoop/workspace/wordcount/home/ha

浏览 4提问于2015-08-06得票数 0

1回答

Windows 10上的Apache hadoop安装

、、、

在Windows10上设置没有Cygwin的单节点集群时，我遵循了特定的文档- 我在使用D:\hadoop-2.6.2.tar\hadoop-2.6.2\hadoop-2.6.2\sbin>start-dfs.cmd启动hdfs时遇到以下错误错误消息堆栈跟踪： 17/01/12 12:25:42 FATAL datanode.DataNode: Exception in secureMain java.lang.RuntimeException: Error while running command to get file permissions : ExitCodeExcepti

浏览 0提问于2017-01-12得票数 3

1回答

数据节点容量为0kb

、、

我正试着和Hadoop打交道。我的问题可能很基本，请容忍我。我正在阅读Hadoop:一个最终指南，并遵循天气数据教程。在将数据复制到HDFS时，我收到以下错误： 13/09/02 16:34:35 ERROR hdfs.DFSClient: Failed to close file /user/bhushan/gz/home/bhushan/ncdc_data/ftp3.ncdc.noaa.gov/pub/data/noaa/1901.gz org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /user/bhush

浏览 3提问于2013-09-02得票数 2

3回答

Apache Spark会话：(路径)的IOException: mkdir失败

、、、

我正在测试Apache Spark 2.0的新版本，尝试使用结构化的流功能，使用一个非常简单的代码来创建一个包含流数据的数据集，然后打印创建的数据集。这是我的代码： SparkSession mySession= SparkSession.builder().appName("ProcessData").master("local[*]").config("spark.sql.warehouse.dir","System.getProperty(\"user.dir\")/warehouse").getOr

浏览 1提问于2016-09-29得票数 2

1回答

使用Hadoop的OpenCL

、、

如何在Hadoop中使用OpenCL(用于GPU计算)？我的数据集驻留在HDFS中。我需要计算5个指标，其中2个是计算密集型的。因此，我希望在GPU上使用OpenCL计算这2个指标，在Hadoop上使用java map reduce代码计算其余3个指标。如何将数据从HDFS传递到GPU？或者我的opencl代码如何从HDFS访问数据？如何从我的Java map reduce代码中触发OpenCL代码？如果有人能分享一个示例代码，那就太好了。

浏览 0提问于2013-05-13得票数 0

2回答

如何干净利落地卸载Eclipse MapReduce插件？

、、、

我正在尝试使用用于hadoop开发的eclipse插件，我使用的是hadoop 0.18.3。我在Eclipsev3.5.2 (M20100211-1343)上安装了旧的MapReduce插件()，方法是将它复制到/Applications/ Eclipse / plugin并重启eclipse，但这不起作用，我想这是因为它是为hadoop和eclipse (大约2007年)的旧版本开发的。然后我意识到hadoop发行版在contrib/eclipse-plugin下有一个jar -所以把它复制到/Application/eclipse/plugins并重启...然后事情变得怪怪的。所以我试着

浏览 1提问于2010-03-27得票数 3

2回答

无法格式化namenode - java.lang.NullPointerException的Hadoop

关于我的安装的一些细节： Ubuntu 14.04 LTS 64位 Oracle 1.8.0_40 Hadoop 2.6.0 我一直按照的指示安装Hadoop。一切都很好，直到我必须格式化namenode为止。当我运行$ hadoop namenode -format时，会得到以下错误： DEPRECATED: Use of this script to execute hdfs command is deprecated. Instead use the hdfs command for it. 15/04/12 19:01:02 INFO namenode.Name

浏览 5提问于2015-04-12得票数 3

2回答

不能将带有Array<Struct<>> org.json.JSONArray的蜂巢服务器错误转换为[Ljava.lang.Object；

、、、

我创造了一张桌子：添加jar /../xlibs/hive-json-serde-0.2.jar；创建外部表SerdeTest (Unique_ID字符串、MemberID字符串、数据ARRAY> ) 分区为(Pyear，Pmonth ) 行格式SERDE "org.apache.hadoop.hive.contrib.serde2.JsonSerde"； ALTER添加分区( TABLE = 2014，Pmonth =03)位置‘./Test2 2’；文件中的数据： {"Unique_ID":"ABC6800650654751“、

浏览 0提问于2014-08-26得票数 1

1回答

datanode DataNode失败卷上的致命磁盘错误：

我将在我的namenode上获得以下日志并从执行中删除我的datanode 2013-02-08 03:25:54,345 WARN namenode.NameNode (NameNodeRpcServer.java:errorReport(825)) - Fatal disk error on xxx.xxx.xxx.xxx:50010: DataNode failed volumes:/home/srikmvm/hadoop-0.23.0/tmp/current; 2013-02-08 03:25:54,349 INFO net.NetworkTopology (NetworkTopo

浏览 3提问于2013-02-07得票数 0

2回答

将50 to数据从本地Hadoop集群迁移到Google云存储

、、

我正在尝试将Hadoop集群中的现有数据(JSON)迁移到。我已经研究过GSUtil，似乎建议将大数据集迁移到GCS。它似乎可以处理庞大的数据集。虽然GSUtil似乎只能将数据从本地机器移动到GCS或S3<->GCS，但是不能将数据从本地Hadoop集群中移动。从本地Hadoop集群向GCS移动数据的推荐方法是什么？在GSUtil的情况下，它可以直接将数据从本地Hadoop集群转移到GCS，还是首先需要在运行GSUtil的机器上复制文件，然后再传输到GCS？使用Google端(Java )库与GSUtil的利弊是什么？非常感谢,

浏览 8提问于2014-08-13得票数 6

回答已采纳

1回答

安装后Hadoop 2.6中没有文件夹

、、、、

我是Hadoop的新手。我通过下面的链接成功地在我的Ubuntu 12.04中安装了Hadoop2.6。所有服务都在运行。但是当我尝试将文件从本地加载到硬盘文件系统时，它根本没有显示硬盘文件系统中的文件夹，如/user或/data hduse@vijee-Lenovo-IdeaPad-S510p:~$ jps 4163 SecondaryNameNode 4374 ResourceManager 3783 DataNode 3447 NameNode 5048 RunJar 18538 Jps 4717 NodeManager hduse@vijee-Lenovo-IdeaPad-S51

浏览 0提问于2015-12-22得票数 0

2回答

资源管理器没有节点

、、、

编辑:我看过，解决方案对我不起作用。我已经在节点管理器日志中附加了连接到资源管理器的部分： [main] client.RMProxy (RMProxy.java:createRMProxy(98)) - Connecting to ResourceManager at /0.0.0.0:8031 2016-06-17 19:01:04,697 INFO [main] nodemanager.NodeStatusUpdaterImpl (NodeStatusUpdaterImpl.java:getNMContainerStatuses(429)) - Sending out 0 NM co

浏览 2提问于2016-06-17得票数 2

回答已采纳

1回答

Hadoop加密区远程异常

、、

我正在尝试在一个空目录/enc_zone2中创建一个加密区域。这是我正在使用的命令 hdfs crypto -createZone -keyName key2 -path /enc_zone2 当我尝试使用以下命令查看密钥列表时 hadoop key list -metadata 我可以看到key2的元数据。但是，我在创建区域时遇到的错误是 "RemoteException: Can't create an encryption zone for /temp since no key provider is available." 但是，KMS服务器已启动并在端口

浏览 1提问于2017-07-12得票数 0

1回答

没有HDFS存储的Hadoop Namenode

、、

我已经安装了一个hadoop集群，共有3台机器，其中2个节点充当数据节点，1个节点充当Namenode，以及一个Datanode。我想澄清关于hadoop集群安装和体系结构的某些疑问。这是我正在寻找答案的问题清单我在集群中上传了一个大小约为500 in的数据文件，然后检查了hdfs报告。我注意到，我制作的namenode在hdfs中也占据了500 am大小，还有复制因子为2的数据节点。这里的问题是，我不希望namenode存储任何数据，简而言之，我不希望它作为datanode工作，因为它也在存储我正在上传的文件。那么，如何使它只充当主节点而不像datanode呢？我尝试在Nam

浏览 0提问于2014-06-11得票数 1

回答已采纳