前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用kellte(ETL工具)对数据的抽取、迁移等操作(入门安装篇)

使用kellte(ETL工具)对数据的抽取、迁移等操作(入门安装篇)

作者头像
游离于山间之上的Java爱好者
发布2022-08-09 15:21:54
2.4K0
发布2022-08-09 15:21:54
举报
文章被收录于专栏:你我杂志刊

Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)

1、Kettle的下载与安装(在本文中使用的kettle版本为8.2.0.0-342) kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/ 2、打开kettle。   首先解压下载下来的压缩包如:pdi-ce-8.2.0.0-342.zip   然后打开Spoon.bat,打开后请耐心等待一会儿时间。如图所示:

3、建立转换。   在文件->新建装换。   新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:

建立数据库连接的过程与其他数据库管理软件连接数据库类似。

注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。

4、简单的数据表插入\更新   (1)新建表插入   在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:

双击拖过来的表,可以编辑表输入。  选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。

(2)通过表输出到表。   在左边面板中选择核心对象、选择“输出->表输出”如图所示:

编辑表输出:   首先:表输入连接表输出。   选中表输入,按住shift键,拖向表输出。

然后:双击表输出,编辑它。

到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。

5、使用作业控制上面装换执行。

使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。

双击start可以编辑,可以设置执行时间等等

点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr

最后点击运行即可。

到这里,一个简单的通过作业调度的kettle就算做完了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 你我杂志刊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档