首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    kettle学习【大牛经验】

    kettle其实是以前的叫法,现在官方称为:PDI(Pentaho Data Integeration)。在windows中,双击目录中的Spoon.bat启动kettle. ?...> 表输入:先配置链接(完成后测试一下是否OK),再输入查询sql(比如:select id from tab2 limit 10;) ? >excel输出。,指定输出路径 ?...第六步:分组(统计-->分组),双击控件后有两个需要关注,一个是分组(相当于group by);一个是聚合(相当于count、sum等函数) 第七步:记录关联(连接-->记录关联(笛卡尔输出));这是一个...join操作,但是没有on条件;但是控件中提供了sql中where条件的刷选 ?...常见错误 第一种:Timestamp:Unable to get timestamp from resultset at index 3**,如图。

    4.5K21

    01-PDI(Kettle)简介与安装

    文章目录 01-PDI(Kettle)简介与安装 PDI(Kettle)简介 Kettle安装 Kettle核心知识点 01-PDI(Kettle)简介与安装 最好的学习资料就是官网,附上官网文档地址:...PDI官方文档地址 https://help.hitachivantara.com/Documentation/Pentaho/9.2/Products/Pentaho_Data_Integration...(Kettle)简介与安装呢,这是因为 Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为:Pentaho Data Integeration,简称“PDI”。...本博客下载的版本为8.2版本,具体下载地址为: https://sourceforge.net/projects/pentaho/files/Pentaho%208.2/client-tools/...跳hop 跳是步骤之间带箭头的连线,跳定义了步骤之间的数据通道。 跳实际上是两个步骤之间的被称为行集的数据行缓存。行集的大小可以在转换的设置里定义。

    2.4K20

    NoSQL为什么需要模式自由的ETL工具?

    Pentaho数据集成(PDI)的元数据注入 Pentaho数据集成虽然有一个独特的功能,称为元数据注入。这使得父类转换能够动态地设置子转换中的步骤配置。它用于许多稍微不同的转换的地方。...PDI辅助数据发现和语义关系发现 但是如何在Hadoop或NoSQL中加载一个可变数据湖,其中包含变化很大的结构呢? 那么,Pentaho数据集成也可以加载这些数据。...数据服务在Pentaho数据集成(PDI)转换中配置。用户点击任何一个步骤,然后说:“我现在所拥有的数据流,我想公开为JDBC兼容的数据源。”...这比传统的SQL翻译层执行速度快得多。 Pentaho平台可以为任何支持查询,搜索或过滤的数据源执行此操作。例如,开发了数据服务来为使用MongoDB和MarkLogic服务器的客户完成这项工作。...总结 在Pentaho数据集成(PDI)中,NoSQL社区可以访问创建无架构和可变架构数据加载以及数据科学和集成转换的能力,同时避免创建大量的转换。从而,大大减少与NoSQL系统相关的执行成本。

    1.8K100

    Kettle安装详细步骤和使用示例

    转换操作示例 4.1 基本概念 4.2 demo 1. kettle概述 Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle 本意是水壶的意思...作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。...mysql-connector-java-5.1.48-bin.jar这个包放进lib目录下 启动Spoon.bat 点击右上方Connect–Other Repositories–Database Repository–Get...➢转换的跳就是步骤之间带箭头的连线,跳定义了步骤之间进行数据传输的 单向通道。 ➢从程序执行的角度看,跳实际上是两个步骤线程之间进行数据行传输的缓 存。...➢配置数据库连接后,“表输入”弹框中会显示新建的数据库连接 ➢在“表输入”弹框中,点击“获取SQL语句”按钮,将弹出“数据库浏览器” ➢选择之前创建好的student表,选择“student”表后,

    3.2K10

    「集成架构」2020年最好的15个ETL工具(第二部)

    #13) Pentaho Data Integration/Kettle ? Pentaho是一家软件公司,提供一种称为Pentaho数据集成(PDI)的产品,也被称为Kettle。...Pentaho数据集成使用户能够清理和准备来自不同来源的数据,并允许在应用程序之间迁移数据。PDI是一个开源工具,是Pentaho商业智能套件的一部分。 主要特点: PDI可用于企业版和社区版。...企业平台有额外的组件,增加了Pentaho平台的能力。 易于使用,易于学习和理解。 PDI的实现遵循元数据方法。 用户友好的图形界面拖放功能。 ETL开发人员可以创建自己的工作。...OWB支持平面文件、Sybase、SQL Server、Informix和Oracle数据库作为目标数据库。 OWB支持数据类型,如数字、文本、日期等。 从这里访问官方网站。...它可以与Text, OLE DB, Oracle, SQL Server, XML, Excel, SQLite, MySQL等。 它从任何数据源(如电子邮件)提取数据。 端到端业务自动化流程。

    2.4K10

    kettle的基础概念入门、下载、安装、部署

    Kettle(现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)。 3、Kettle的结构。 ?...答:Enterprise Console(企业控制台)提供了一个小型的客户端,用于管理Pentaho Data Integration企业版的部署。.../pentaho/Pentaho%208.2/client-tools/ 9、 Kettle的压缩包下载完毕,解压缩即可。...1)、跳就是步骤之间带箭头的连线,跳定义了步骤之间的数据通路。   2)、跳实际上是两个步骤之间的被称之为行集的数据行缓存(行集的大小可以在转换的设置里定义)。   ...5)、Date:带毫秒精度的日期时间值。   6)、Boolean:取值为true和false的布尔值。   7)、Binary:二进制字段可以包含图像、声音、视频及其他类型的二进制数据。

    10.5K20
    领券