社区首页 >问答首页 >PDI读取远程和压缩文件失败

PDI读取远程和压缩文件失败
EN

Stack Overflow用户
提问于 2017-12-13 17:07:02
回答 0查看 215关注 0票数 1

我的问题是当我从S3读取远程压缩文件时,具体地说是压缩文件。文件没有损坏,有时会出现异常,有时不会。

我在这个仍然打开的http://jira.pentaho.com/browse/PDI-1800旧bug中发现了类似的问题。

这就是正在发生的错误。我在一个点菜服务器上运行这个转换。这个错误不容易重现,不幸的是,我没有办法重现它。

代码语言:javascript
代码运行次数:0
复制
org.pentaho.di.core.exception.KettleFileException:
Exception reading line: java.io.EOFException: Unexpected end of ZLIB input stream
Unexpected end of ZLIB input stream
Unexpected end of ZLIB input stream
at org.pentaho.di.trans.steps.fileinput.text.TextFileInputUtils.getLine(TextFileInputUtils.java:326)
at org.pentaho.di.trans.steps.fileinput.text.TextFileInputReader.tryToReadLine(TextFileInputReader.java:420)
at org.pentaho.di.trans.steps.fileinput.text.TextFileInputReader.readRow(TextFileInputReader.java:167)
at org.pentaho.di.trans.steps.fileinput.BaseFileInputStep.processRow(BaseFileInputStep.java:205)
at org.pentaho.di.trans.step.RunThread.run(RunThread.java:62)
at java.lang.Thread.run(Thread.java:745)
Caused by: java.io.EOFException: Unexpected end of ZLIB input stream
at java.util.zip.InflaterInputStream.fill(InflaterInputStream.java:240)
at java.util.zip.InflaterInputStream.read(InflaterInputStream.java:158)
at java.util.zip.ZipInputStream.read(ZipInputStream.java:194)
at org.pentaho.di.core.compress.CompressionInputStream.read(CompressionInputStream.java:68)
at java.io.BufferedInputStream.read1(BufferedInputStream.java:284)
at java.io.BufferedInputStream.read(BufferedInputStream.java:345)
at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284)
at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
at sun.nio.cs.StreamDecoder.read0(StreamDecoder.java:127)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:112)
at java.io.InputStreamReader.read(InputStreamReader.java:168)
at org.pentaho.di.trans.steps.fileinput.text.TextFileInputUtils.getLine(TextFileInputUtils.java:294)5 more
2017/12/13 12:07:40 – S3CsvInput.0ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : Unexpected error
2017/12/13 12:07:40 – S3CsvInput.0ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : org.pentaho.di.core.exception.KettleFileException:
2017/12/13 12:07:40 – S3CsvInput.02017/12/13 12:07:40 – S3CsvInput.0 – Exception reading line: java.io.EOFException: Unexpected end of ZLIB input stream
2017/12/13 12:07:40 – S3CsvInput.0 – Unexpected end of ZLIB input stream
2017/12/13 12:07:40 – S3CsvInput.02017/12/13 12:07:40 – S3CsvInput.0 – Unexpected end of ZLIB input stream
2017/12/13 12:07:40 – S3CsvInput.02017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.steps.fileinput.text.TextFileInputUtils.getLine(TextFileInputUtils.java:326)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.steps.fileinput.text.TextFileInputReader.tryToReadLine(TextFileInputReader.java:420)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.steps.fileinput.text.TextFileInputReader.readRow(TextFileInputReader.java:167)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.steps.fileinput.BaseFileInputStep.processRow(BaseFileInputStep.java:205)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.step.RunThread.run(RunThread.java:62)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.lang.Thread.run(Thread.java:745)
2017/12/13 12:07:40 – S3CsvInput.0 – Caused by: java.io.EOFException: Unexpected end of ZLIB input stream
2017/12/13 12:07:40 – S3CsvInput.0 – at java.util.zip.InflaterInputStream.fill(InflaterInputStream.java:240)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.util.zip.InflaterInputStream.read(InflaterInputStream.java:158)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.util.zip.ZipInputStream.read(ZipInputStream.java:194)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.core.compress.CompressionInputStream.read(CompressionInputStream.java:68)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.io.BufferedInputStream.read1(BufferedInputStream.java:284)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.io.BufferedInputStream.read(BufferedInputStream.java:345)
2017/12/13 12:07:40 – S3CsvInput.0 – at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284)
2017/12/13 12:07:40 – S3CsvInput.0 – at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326)
2017/12/13 12:07:40 – S3CsvInput.0 – at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
2017/12/13 12:07:40 – S3CsvInput.0 – at sun.nio.cs.StreamDecoder.read0(StreamDecoder.java:127)
2017/12/13 12:07:40 – S3CsvInput.0 – at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:112)
2017/12/13 12:07:40 – S3CsvInput.0 – at java.io.InputStreamReader.read(InputStreamReader.java:168)
2017/12/13 12:07:40 – S3CsvInput.0 – at org.pentaho.di.trans.steps.fileinput.text.TextFileInputUtils.getLine(TextFileInputUtils.java:294)
2017/12/13 12:07:40 – S3CsvInput.0 – … 5 more
child index = 56, logging object : org.pentaho.di.core.logging.LoggingObject@46345a23 parent=1ff32099-5cbe-47b3-b32c-34f1291f6c09
2017/12/13 12:07:40 – md5_field12308.0 – Finished processing (I=0, O=0, R=391170, W=782340, U=0, E=0)
2017/12/13 12:07:40 – Filter Rows field12308.0 – Finished processing (I=0, O=0, R=3, W=3, U=0, E=0)
2017/12/13 12:07:40 – Filter Rows field12315.0 – Finished processing (I=0, O=0, R=13, W=13, U=0, E=0)
2017/12/13 12:07:40 – TransLoad_cube5403_data137170 – ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : Errors detected!
EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47798663

复制
相关文章
编译Kettle的PDI DB Dialog模块失败
检查了一下下面的地址,发现其下没有小写i的目录,只有大写I的目录,估计是这几天第三方包有改过名字所导致的。
kongxx
2018/12/12
1.5K0
06-PDI(Kettle)读取Hive写入HDFS,读取HDFS写入HBase中
本文主要通过Kettle完成对Hive和HBase中数据的读写工作,为了便于按照文档即可实现Kettle的读写Hive和HBase,文本前面也介绍下Hive的安装过程,如何Hive已经完成安装,可跳过前面即可。 实验环境: cetnos7.4
用户2225445
2022/11/12
1.5K0
06-PDI(Kettle)读取Hive写入HDFS,读取HDFS写入HBase中
pycharm远程部署_远程连接服务器失败
File → Settings → Project:XXX →Python Interpreter
全栈程序员站长
2022/09/25
21.6K0
pycharm远程部署_远程连接服务器失败
如何在Scala中读取Hadoop集群上的gz压缩文件
存在Hadoop集群上的文件,大部分都会经过压缩,如果是压缩后的文件,我们直接在应用程序中如何读取里面的数据?答案是肯定的,但是比普通的文本读取要稍微复杂一点,需要使用到Hadoop的压缩工具类支持,比如处理gz,snappy,lzo,bz压缩的,前提是首先我们的Hadoop集群得支持上面提到的各种压缩文件。 本次就给出一个读取gz压缩文件的例子核心代码: 压缩和解压模块用的工具包是apache-commons下面的类: import org.apache.commons.io.IOUtils impor
我是攻城师
2018/05/14
2.7K0
java直接读取.zip压缩文件ZipEntry.getsize()总是返回-1?
但是后面发现一个问题,读取的时候总是返回-1 ze.getSize()的值总是-1,可是名字都到了。 找不到法子,着实无奈,后面换了种方式,干脆将文件解压出来之后,在对文件里面的内容进行验证文件名和文件大小好了
软测小生
2019/07/05
2.9K0
java直接读取.zip压缩文件ZipEntry.getsize()总是返回-1?
SecureCRT远程连接Ubuntu失败解决案例
使用VirtualBox搭建一个Ubuntu14.04的系统环境,为了省去主机与虚拟机直接互相直接一直切换的频繁操作,所以想到了使用SecureCRT连接,但是出现了连接问题,问题如下图:
用户8705036
2021/06/08
2.1K0
05-PDI(Kettle)脚本执行
作业和转换可以在图形化界面里执行,但这只是在开发、测试和调试阶段。在开发完成后,需要部署到实际运行环境,在部署阶段,Spoon就很少用到了。
用户2225445
2022/11/12
1.1K0
05-PDI(Kettle)脚本执行
XP上XamlReader读取XAML失败的问题
项目中DataGrid需要合并列,开始还以为XP不支持WPF动态模版创建,后来发现是XP上不支持绑定数据的格式化(加¥),把StringFormat={}{0:C}, ConverterCulture=zh-CN去掉,就可以正常绑定数据了
kiki.
2022/09/29
6660
04-PDI(Kettle)job案例
本实验是kettle的作业设计,区别与步骤的并行执行,作业的各作业项具有先后执行顺序,这在处理某些问题的时候具有很大优势。 一个作业包含一个或多个作业项,这些作业项以某种顺序来执行。作业执行顺序由作业项之间的跳(Hop)和每个作业项的执行结果来决定,和转换一样,作业也包括注释。作业项可以是一个转换,也可是另一个作业项。
用户2225445
2022/11/12
6000
04-PDI(Kettle)job案例
Kettle(PDI)的坑,有点大
网络上有不少Kettle的文章,但实际上都大同小异,都是些非常基础的文章,实际上在使用过程中还有遇到不少的坑,这部分在网上资料比较少,这里主要讲一下我们在使用过程中遇到的各种问题,属于难得的实践经验。
源哥
2020/06/07
8.5K1
解决:Navicat远程连接mysql失败「建议收藏」
sudo vi /etc/mysql/mysql.conf.d/mysqld.cnf
全栈程序员站长
2022/11/19
2.8K0
【日常排雷】 .Net core 生产环境appsetting读取失败
关键词System.ArgumentNullException: String reference not set to an instance of a String. (Parameter 's')
DDGarfield
2022/06/23
9500
【日常排雷】 .Net core 生产环境appsetting读取失败
MySQL远程连接失败(错误码:2003)
1. 环境信息 服务器系统:Centos 7.6 服务器MySQL版本:8.0.25 本地系统:Windows10 本地客户端:navicat 15 2. 本地客户端连接远程服务器MySQL报错 3.
框架师
2021/08/05
17.5K2
读取远程文件影响网站打开解决
有两种办法: 第一使用:设置超时时间 ini_set("max_execution_time", 2); $url = "http://www.0377joyous.com/test.php"; $html = @file_get_contents($url); echo $html; 第二种使用:get_headers() 这个函数会返回一个数组 $url = ‘http://www.0377joyous.com/test.php’; if (get_headers($url)<>false) { $
苦咖啡
2018/05/07
1.2K0
ssh远程连接失败_ssh connect to host port 22
不少人在ssh连接远程机器时遇到过ssh_exchange_identification: Connection closed by remote host的问题,在网上找了一堆教程试了都不行,博主总结了常见的几种解决方法(以Ubuntu18.04为例)。
全栈程序员站长
2022/09/27
3.9K0
shell--ssh解析本地变量到远程失败
很多问题都是由于双眼号引起的,但是shell标准确很喜欢让开发者加上双眼号。 脚本通过ssh远程操作其它相器,正常情况下脚本会将我本机的脚本变量带到远程机器上,这个脚本一直远行正常。 然后看到一个shell的变量使用规范,要在大部分重要的变量是加上又眼号,我就这么干了,然后就出问题了。
潇洒
2023/10/20
2220
Java 远程调用失败?如何优雅的进行重试?
在日常开发的过程中我们经常会需要调用第三方组件或者数据库,有的时候可能会因为网络抖动或者下游服务抖动,导致我们某次查询失败。
Java极客技术
2022/12/04
9310
Java 远程调用失败?如何优雅的进行重试?
PostgreSQL启动恢复读取checkpoint记录失败的条件
1、首先读取ControlFile->checkPoint指向的checkpoint 2、如果读取失败,slave直接abort退出,master再次读取ControlFile->prevCheckPoint指向的checkpoint StartupXLOG->     |--checkPointLoc = ControlFile->checkPoint;     |--record = ReadCheckpointRecord(xlogreader, checkPointLoc, 1, true):     |-- if (record != NULL){           ...         }else if (StandbyMode){             ereport(PANIC,(errmsg("could not locate a valid checkpoint record")));         }else{             checkPointLoc = ControlFile->prevCheckPoint;             record = ReadCheckpointRecord(xlogreader, checkPointLoc, 2, true);             if (record != NULL){                 InRecovery = true;//标记下面进入recovery             }else{                 ereport(PANIC,(errmsg("could not locate a valid checkpoint record")));             }         }
星哥玩云
2022/08/17
8000
01-PDI(Kettle)简介与安装
最好的学习资料就是官网,附上官网文档地址: PDI官方文档地址 https://help.hitachivantara.com/Documentation/Pentaho/9.2/Products/Pentaho_Data_Integration
用户2225445
2022/11/12
2.4K0
01-PDI(Kettle)简介与安装
点击加载更多

相似问题

釜(PDI) 8.1读取xml错误

20

压缩文件静默读取失败吗?

16

jQuery和XML-读取远程资源失败

11

错误:任务':app:transformDexWithInstantRunSlicesApkForDebug'.执行失败读取压缩文件失败

40

使用jsch和sftp读取远程文件-失败4

12
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文