SequenceFile - 腾讯云开发者社区

文章/答案/技术大牛

发布

4回答

使用Hadoop2.0Apis读写顺序文件

createWriter(Configuration conf, org.apache.hadoop.io.SequenceFile.Writer.Option... opts) 同样，我需要知道读取序列文件的代码是什么，因为取消了折叠： String uri

浏览 3提问于2013-04-17得票数 18

回答已采纳

1回答

Mahout:缺少用于创建序列文件的类

、、、、

我按照上的说明将现有文件转换为序列文件：at org.apache.hadoop.io.SequenceFile$RecordCompressWriter.<init>(SequenceFile.java:1136) at org.apache.hadoop.io.SequenceFile.c

浏览 5提问于2015-03-11得票数 0

0回答

SequenceFile.Writer writer = SequenceFile.createWriter(FileContext.getFileContext(conf), conf, sequenceFile我也尝试了下面的选项，但没有成功： Writer writer = SequenceFile.createWriter(conf, SequenceFile.Writer.file(sequenceFile), SequenceFile.Writer.keyC

浏览 7提问于2017-01-01得票数 1

2回答

找不到Hadoop序列化程序异常

、、

org.apache.hadoop.io.serializer.SerializationFactory.getSerializer(SerializationFactory.java:73)at org.apache.hadoop.io.SequenceFile$Writer.<init>(SequenceFile.java:892) at org.apache.h

浏览 2提问于2012-09-15得票数 2

回答已采纳

1回答

如何知道它是哪种序列文件？

、、

我是Hadoop的新手，遇到过几个序列文件。在我阅读时，有3种方法可以创建序列文件。现在我有了一个序列文件，我如何知道它是哪种类型的序列文件。我如何阅读有关这方面的Meta信息。我需要这个，因为我有一个序列文件，预计我会创建一个类似的序列文件。

浏览 8提问于2016-08-26得票数 0

1回答

图像的Avro文件类型？

、、

什么是最好的文件格式Avro或SequenceFile，以防将图像存储在HDFS中，然后用Python处理它们？ SequenceFile是面向关键值的，所以我认为Avro文件会工作得更好吗？

浏览 2提问于2014-06-06得票数 1

回答已采纳

1回答

适用于hadoop 0.20.203的MapFileOutputFormat

我有一个hadoop作业，我希望将其输出到MapFile，但我必须在没有MapFileOutputFormat的运行hadoop0.20.203的集群上运行。有没有办法将SequenceFileOutputFormat (我相信它可能包含多个SequenceFiles)的输出并行地转换成一个MapFile (它可能非常大)？那么ArrayFile (如果所有的键都是整数，并且相对精简)呢？

浏览 28提问于2011-12-05得票数 0

回答已采纳

1回答

kafka-connect-hdfs : SequenceFileWriter在连接器重启时创建坏文件，导致SequenceFileReader中出现EOFException

、、、、

writer; SequenceFile.Writer.OptionoptKey = SequenceFile.Writer.keyClass(LongWritable.class); SequenceFile.Writer.Option optVal = SequenceFile.Writer.valueClass(Text.

浏览 8提问于2018-09-17得票数 0

1回答

Hadoop:中间合并失败

、、

我遇到了一个奇怪的问题。当我在大型数据集(>1TB压缩文本文件)上运行Hadoop作业时，有几个reduce任务会失败，其堆栈跟踪如下： at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:385) at ja

浏览 3提问于2011-04-07得票数 7

1回答

InputStream到Hadoop SequenceFile

、、

我想从它创建一个SequenceFile.Reader或类似的类，而不需要将输出流写入磁盘上的临时文件。是否有什么东西会让我从输入流到允许我从输入流读取键/值对的东西。

浏览 2提问于2014-04-07得票数 0

4回答

C++：在函数中使用argv[1]读取.txt文件时出错

、、、

的字符串： {cout<<"File opened"<<endl;

浏览 4提问于2016-12-17得票数 0

回答已采纳

1回答

创建Hadoop序列文件

、、

我成功地在HDFS中创建了一个序列文件，但是如果我试图读取一个序列文件，“序列文件而不是SequenceFile”会发生错误。我还检查了HDFS中创建的序列文件。 (config, SequenceFile.Writer.file(path), SequenceFile.Writer.keyClass(key.getClass()),$Reader.initialize(SequenceFile.java:1892) at org.apache的SequenceFile。hadoop.io.<em

浏览 4提问于2018-09-17得票数 1

回答已采纳

1回答

Hadoop序列化嵌套对象

、、、

org.apache.hadoop.io.serializer.SerializationFactory.getSerializer(SerializationFactory.java:73)at org.apache.hadoop.io.SequenceFile$Writer.<init>(SequenceFile.java:892) at org.apache.h

浏览 3提问于2012-09-16得票数 0

回答已采纳

1回答

如何读取Hadoop中间文件file.out

、、

_0001/attempt_201403260903_0001_m_000000_0/output/和file.out.indexIntWritable key = new IntWritable(); IntWritable valueat org.apache.hadoop.io.SequenceFile$

浏览 4提问于2014-03-26得票数 1

1回答

hsync()不适用于SequenceFile编写器

、、

我有一个小程序，它每秒向HDFS上的块压缩同步写入10条记录，然后每5分钟运行一次SequenceFile ()，以确保超过5分钟的所有内容都可用于处理。writer = SequenceFile.createWriter( SequenceFile.Writer.file(path), SequenceFile.Writer.valueClass(T

浏览 2提问于2015-03-09得票数 2

1回答

是否可以使用异常检查HDFS上的文件是否为SequenceFile而没有(Mis)？

、、

我想从客户端应用程序读取HDFS中的特定SequenceFile。我可以通过使用SequenceFile.Reader来做到这一点，而且它工作得很好。但是，是否也可以通过分析抛出的SequenceFile来检查文件是否是其他IOException呢？

浏览 5提问于2014-11-07得票数 2

回答已采纳

2回答

附加到现有序列文件

、

下面是我用来附加到现有序列文件outputfile的代码，但是在后面读取序列文件时，它正在抛出校验和错误： Path sequenceFile = new Path("/Users/{homedirectory}/Desktop/SampleText val

浏览 5提问于2016-12-27得票数 0

1回答

Google Bigtable导出失败并返回java.lang.NoSuchMethodError

DataOutputStream.java:107)at org.apache.hadoop.io.SequenceFile$Writer.writeFileHeader(SequenceFile.java:1145)at org.apache.ha

浏览 0提问于2018-05-26得票数 2

2回答

HDFS:使用HDFS追加到SequenceFile

、

问题是，如果存在SequenceFile，下面的调用将只是覆盖SequenceFile，而不是附加到它。// fs and conf are set up for HDFS, not as a LocalFileSystem keyClass, valueClass, SequenceFile.CompressionType.NONE);我

浏览 2提问于2011-04-08得票数 4

1回答

火花作业中的Kryo序列化错误

、、

在org.apache.hadoop.io.SequenceFile$Writer.init(SequenceFile.java:1179) at org.apache.hadoop.io.SequenceFile(SequenceFile.java:1094) at org.apache.hadoop.io.SequenceFile.createWriter(SequenceFile.java:273) atorg.apache.hadoop.io.SequenceFile</

浏览 3提问于2015-09-21得票数 1

回答已采纳

点击加载更多