开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Pentaho数据集成不能与Openjdk 16一起使用

Pentaho数据集成是一款强大的数据集成工具，用于将不同数据源的数据整合到一起，进行数据清洗、转换和加载等操作。然而，Pentaho数据集成在与Openjdk 16一起使用时可能会出现兼容性问题。

Openjdk 16是Java的一种开源实现，提供了最新的Java功能和性能优化。然而，由于Pentaho数据集成的某些组件可能依赖于特定的Java版本或库，因此与Openjdk 16一起使用可能导致不兼容或功能受限的情况。

为了解决这个问题，建议使用与Pentaho数据集成兼容的Java版本，例如Openjdk 8或其他经过测试和验证的Java版本。这样可以确保Pentaho数据集成的正常运行和最佳性能。

在使用Pentaho数据集成时，可以考虑以下场景和应用：

数据仓库集成：Pentaho数据集成可以将来自不同数据源的数据整合到数据仓库中，为企业提供全面的数据分析和决策支持。
ETL流程：Pentaho数据集成可以进行数据抽取、转换和加载（ETL）操作，帮助企业实现数据的清洗、转换和整合，以满足不同业务需求。
数据迁移：Pentaho数据集成可以帮助企业将数据从一个系统迁移到另一个系统，包括数据库迁移、应用程序迁移等。
数据同步：Pentaho数据集成可以实现不同数据源之间的实时数据同步，确保数据的一致性和准确性。

对于Pentaho数据集成的具体产品和解决方案，腾讯云提供了一系列相关产品和服务，包括：

腾讯云数据集成服务：提供了一站式的数据集成解决方案，包括数据抽取、转换和加载等功能，支持多种数据源和目标系统。
腾讯云数据仓库：提供了高性能、可扩展的数据仓库服务，支持大规模数据存储和分析，与Pentaho数据集成相互兼容。
腾讯云数据库服务：提供了多种数据库服务，包括关系型数据库（如MySQL、SQL Server）和NoSQL数据库（如MongoDB、Redis），可与Pentaho数据集成进行集成和数据交互。

更多关于腾讯云数据集成相关产品和服务的详细信息，请参考腾讯云官方网站：腾讯云数据集成服务。

需要注意的是，以上提到的产品和服务仅作为示例，具体选择应根据实际需求和情况进行评估和决策。

相关搜索:本地不能与docker和openjdk图像一起使用。Pentaho数据集成在16位数字后对十进制值进行舍入数据库不能与克隆的laravel项目一起使用来自p的SortBy :数据表不能与dataModel一起使用也使用sqlCipher时，DBflow不能与现有数据库一起使用 Python 3数据类的默认值不能与属性一起使用使用npm uuid包的React 16表数据更新操作不更新行数据使用get或post时，Laravel数据表不能与服务器端一起使用 Google App Engine (GAE)的远程Shell中的数据存储不能与zsh一起使用为什么视图上的F3数据库查询不能与sqlite一起使用 ASP.NET MVC5 JQuery数据表CSS不能与引导流明一起使用数据框包含值不能与"np.where“一起使用，并且有一个值错误 IntelliJ数据库资源管理器不能与本地主机Mongo4.4.3一起使用当单热编码训练和测试数据时，形状不匹配。将Test_data与管道一起使用时，Train_Data比get_dummies具有更多的虚列

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

「集成架构」ETL工具大比拼：Talend vs Pentaho

数据总是巨大的，任何行业都必须存储这些“数据”，因为它带有巨大的信息，从而导致他们的战略规划。正如人们需要房子感到安全一样，数据也必须得到保障。这个数据主页在技术上称为数据仓库。

02

NoSQL为什么需要模式自由的ETL工具？

本文介绍了如何使用Pentaho Data Integration (Kettle) 和Pentaho Business Intelligence (Kibana)实现大数据的加载、转换、分析和可视化。首先介绍了如何使用Kettle从多个数据源加载数据，然后介绍了如何使用Kibana进行数据转换、分析和可视化。最后介绍了如何使用Kettle和Kibana进行大数据处理，包括数据转换、数据清洗、数据集成和数据可视化等。

「集成架构」2020年最好的15个ETL工具(第二部)

ETL代表提取、转换和加载。它是从任何数据源中提取数据并将其转换为适当格式以供存储和将来参考的过程。

01

基于云计算的数据集成工具

选择基于云计算的集成工具时有几个关键考虑因素。重点关注工具提供的连接器集、服务的可扩展性、解决方案的运行速度，以及提供的安全级别。还需要考虑许多关键的管理功能。

01

kettle的基础概念入门、下载、安装、部署

答：ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种etl工具的使用，必不可少，这里我要学习的ETL工具是Kettle！

02

【性能分析】大数据分析工具

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器，气候信息，公开的信息，如杂志，报纸，文章。大数据产生的其他例子包括购买交易记录，网络日志，病历，军事监控，视频和图像档案，及大型电子商务。

05

【工具】六大工具帮你做好大数据分析

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器、气候信息、公开的信息、如杂志、报纸、文章。大数据产生的其他例子包括购买交易记录、网络日志、病历、事监控、视频和图像档案、及大型电子商务。大数据分析是在研究大量的数据的过程中寻找模式，相关性和其他有用的信息，可以帮助企业更好地适应变化，并做出更明智的决策。 Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是

07

6个用于大数据分析的最好工具

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器，气候信息，公开的信息，如杂志，报纸，文章。大数据产生的其他例子包括购买交易记录，网络日志，病历，军事监控，视频和图像档案，及大型电子商务。

02

大数据处理分析的六大工具

下面请看详细介绍： Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计算元

6个用于大数据分析的最好工具

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器，气候信息，公开的信息，如杂志，报纸，文章。大数据产生的其他例子包括购买交易记录，网络日志，病历，军事监控，视频和图像档案，及大型电子商务。在大数据和大数据分析，他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式，相关性和其他有用的信息，可以帮助企业更好地适应变化，并做出更明智的决策。一 Hadoop Hadoo

05

6个用于大数据分析的最好工具

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源：传感器，气候信息，公开的信息，如杂志，报纸，文章。大数据产生的其他例子包括购买交易记录，网络日志，病历，军事监控，视频和图像档案，及大型电子商务。

02

强烈推荐！大数据领域的顶级开源工具大集合

随着大数据与预测分析的成熟，开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。如今，从小型初创企业到行业巨头，各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术，新兴公司甚至在很多方面都可以与大厂商抗衡。以下是一些大数据方面的顶级开源工具，分为四个领域：数据存储、开发平台、开发工具和集成、分析和报告工具。数据存储： Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt NoSql 数据库 – MongoDB,

08

大数据处理必备的十大工具

Hive是一个建立在Hadoop上的开源数据仓库基础设施，通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和处理等。 Hive提供了一种简单的类似SQL的查询语言—HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。

03

大数据处理必备的十大工具！

大数据的日益增长,给企业管理大量的数据带来了挑战的同时也带来了一些机遇。下面是用于信息化管理的大数据工具列表： 1.ApacheHive 📷 Hive是一个建立在hadoop上的开源数据仓库基础设施，通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和处理等。Hive提供了一种简单的类似SQL的查询语言—HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。 2JaspersoftBI套件 📷 Jaspersoft包是一个通过数据库列生成报表的开源软件。

07

ETL主要组成部分及常见的ETL工具介绍

ETL（Extract-Transform-Load）技术是数据集成领域的核心组成部分，广泛应用于数据仓库、大数据处理以及现代数据分析体系中。它涉及将数据从不同的源头抽取出来，经过必要的转换处理，最后加载到目标系统（如数据仓库、数据湖或其他分析平台）的过程。以下是ETL技术栈的主要组成部分和相关技术介绍：

01

Kettle教程一：Kettle简介和Kettle的部署安装

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于开发或者运维人员来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种ETL工具的使用，必不可少，这里我们要学习的ETL工具就是Kettle！

06

5款开源BI工具优缺点及介绍

在为公司进行大数据BI工具的选型时，尤其是在起步阶段，开源选项可以提供较低的入门成本和较高的灵活性。针对几种流行的开源BI报表展示工具，以及它们的优缺点，谈一下自己的看法。

01

2022 年最佳 ETL 工具：提取转换和加载软件

ETL 工具已经使用了近五年，使组织能够持续分析、开发和处理数据，数家数据库管理、分析和商业智能领域的资深企业供应商继续保持领先地位，同时，行业解决方案在 2022 年不断演进，以满足云和边缘数据处理需求。

02

干货 | 19款最好用的免费数据挖掘工具大汇总

数据在当今世界意味着金钱。随着向基于app的世界的过渡，数据呈指数增长。然而，大多数数据是非结构化的，因此需要一个过程和方法从数据中提取有用的信息，并将其转换为可理解的和可用的形式。

02

【干货】推荐19款最常用的数据挖掘工具

数据在当今世界意味着金钱。随着向基于app的世界的过渡，数据呈指数增长。然而，大多数数据是非结构化的，因此需要一个过程和方法从数据中提取有用的信息，并将其转换为可理解的和可用的形式。

03

【商业智能】大数据和BI商业智能的差别和影响

之所以要区分大数据应用与BI(商业智能)，是因为大数据应用与BI、数据挖掘等，并没有一个相对完整的认知。　　BI(BusinessIntelligence)即商务智能，它是一套完整的解决方案，用来将企业中现有的数据进行有效的整合，快速准确的提供报表并提出决策依据，帮助企业做出明智的业务经营决策。　　伴随着BI的发展，是ETL，数据集成平台等概念的提出。　　ETL，Extraction Transformation Loading，数据提取、转换和加载，数据集成平台主要功能对各种业务数据进行抽取和相关

09

干货 | 19款最好用的免费数据挖掘工具大汇总

数据在当今世界意味着金钱。随着向基于app的世界的过渡，数据呈指数增长。然而，大多数数据是非结构化的，因此需要一个过程和方法从数据中提取有用的信息，并将其转换为可理解的和可用的形式。

02

目前最火的12款，开源大数据分析框架

我们在本文中介绍了市面上12款顶尖的开源数据分析解决方案，其中一些为大数据分析提供了全面的端到端平台，另一些要与其他技术结合起来。它们都适合大企业使用，都是市面上领先的数据分析工具。　　1.

07

15个国外顶级的大数据分析工具

嵌入式分析在传统业务应用程序（如HR系统，CRM或ERP）的范围内提供商业智能。这些分析在用户的正常工作流程中提供上下文敏感的决策支持。

04

收藏丨值得关注的12大开源大数据分析应用软件

对于许多大企业来说，开源大数据分析已经成为日常业务中一个必不可少的组成部分。据New Vantage Partners公司对《财富》1000强公司的高层主管开展的调查显示，如今62.5%的企业在生产环

08

最全面最详细的ETL工具选项指南

ETL是数据仓库和数据集成领域常用的缩写，代表Extract, Transform, Load（提取、转换、加载）三个步骤。它是一种数据处理过程，用于从不同的数据源中提取数据、对数据进行转换和清洗，并将处理后的数据加载到目标系统或数据仓库中。

03

数据映射工具

当您正在集成所有数据以存储在数据仓库中以进行最终用户分析时，必须映射数据。数据映射在一个信息源和另一个信息源之间进行转换，基本上将数据源字段与数据仓库中的目标字段进行匹配。

05

「集成架构」2020年最好的15个ETL工具(第一部)

ETL代表提取、转换和加载。它是从任何数据源中提取数据并将其转换为适当格式以供存储和将来参考的过程。

02

kettle相关知识

开源ETL工具(Kettle) V5.1.0 免费Spoon版 http://www.cr173.com/soft/30051.html ETL工具大全，你了解多少 http://bbs.csdn.net/topics/390349305 Kettle_抽取数据举例 http://blog.csdn.net/huangyanlong/article/details/42264543

04

【知识】ETL大数据集成工具Sqoop、dataX、Kettle、Canal、StreamSets大比拼

对于数据仓库，大数据集成类应用，通常会采用ETL工具辅助完成。ETL，是英文 Extract-Transform-Load 的缩写，用来描述将数据从来源端经过抽取（extract）、交互转换（transform）、加载（load）至目的端的过程。当前的很多应用也存在大量的ELT应用模式。常见的ETL工具或类ETL的数据集成同步工具很多，以下对开源的Sqoop、dataX、Kettle、Canal、StreamSetst进行简单梳理比较。

02

Pentaho Work with Big Data（六）—— 使用Pentaho MapReduce生成聚合数据集

本示例说明如何使用Pentaho MapReduce把细节数据转换和汇总成一个聚合数据集。当给一个关系型数据仓库或数据集市准备待抽取的数据时，这是一个常见使用场景。我们使用格式化的web日志数据作为细节数据，并且建立一个聚合文件，包含按IP和年月分组的PV数。关于如何使用Pentaho MapReduce把原始web日志解析成格式化的记录，参考 http://blog.csdn.net/wzy0623/article/details/51145570。一、向HDFS导入示例数据文件将weblogs_parse.txt文件放到HDFS的/user/grid/parse/目录下（因资源有限，本示例只取了这个文件的前100行数据）参考： http://blog.csdn.net/wzy0623/article/details/51133760 二、建立一个用于Mapper的转换 1. 新建一个转换，如图1所示。

03

[大数据测试]ETL测试工具和面试常见的问题及答案

概述商业信息和数据对于任何一个企业而言都是至关重要的。现在很多公司都投入了大量的人力、资金和时间对这些信息、数据进行分析和整理。数据的分析和整理已经获得了巨大的潜在市场，因此为了使得这个过程更为简单，越来越多的软件供应商引入了ETL测试工具。目前，有需要开源的ETL工具，供应商允许用户直接从他们的官方网站免费下载，但有可能升级到新版或企业版需要订阅付费。所以我们需要根据企业的不同业务结构和模型，在选择ETL工具之前，对其进行分析。在这些开源的ETL工具的帮助下，我们将有机会尝试在不

06

[大数据测试]ETL测试工具和面试常见的问题及答案

概述商业信息和数据对于任何一个企业而言都是至关重要的。现在很多公司都投入了大量的人力、资金和时间对这些信息、数据进行分析和整理。数据的分析和整理已经获得了巨大的潜在市场，因此为了使得这个过程更为简单，越来越多的软件供应商引入了ETL测试工具。目前，有需要开源的ETL工具，供应商允许用户直接从他们的官方网站免费下载，但有可能升级到新版或企业版需要订阅付费。所以我们需要根据企业的不同业务结构和模型，在选择ETL工具之前，对其进行分析。在这些开源的ETL工具的帮助下，我们将有机会尝试在不

08

知识分享之Java——Maven的settings常用配置文件

日常我们开发时，我们会遇到各种各样的奇奇怪怪的问题（踩坑o(╯□╰)o），这个常见问题系列就是我日常遇到的一些问题的记录文章系列，这里整理汇总后分享给大家，让其还在深坑中的小伙伴有绳索能爬出来。同时在这里也欢迎大家把自己遇到的问题留言或私信给我，我看看其能否给大家解决。

01

荐读|数据湖是什么东东数据湖的四个最佳实践

数据湖听起来很简单：把数据或信息汇集到一个结合处理速度和存储空间的大数据系统――Hadoop集群或内存解决方案，那样业务部门就能访问数据，获取新的洞察力。不过，与IT行业的许多技术一样，现实比梦想困难

04

Kettle与Hadoop（五）执行MapReduce

本示例说明如何使用Pentaho MapReduce把原始web日志解析成格式化的记录。

03

企业数据集成怎么做？详解ETL+BI的构建过程!

在数字化转型的浪潮中，数据已经成为企业的重要资产，而商业智能（BI）项目则是帮助企业利用数据进行分析、洞察和决策的关键工具。尽管BI项目的目标是实现数据驱动的决策，但实际上，项目中大部分时间和资源都被用于数据的提取、转换和加载（ETL）过程，只有约20%的时间用于BI可视化。

01

07 Confluent_Kafka权威指南第七章：构建数据管道

当人们讨论使用apache kafka构建数据管道时，他们通常会应用如下几个示例，第一个就是构建一个数据管道，Apache Kafka是其中的终点。丽日，从kafka获取数据到s3或者从Mongodb获取数据到kafka。第二个用例涉及在两个不同的系统之间构建管道。但是使用kafka做为中介。一个例子就是先从twitter使用kafka发送数据到Elasticsearch，从twitter获取数据到kafka。然后从kafka写入到Elasticsearch。我们在0.9版本之后在Apache kafka 中增加了kafka connect。是我们看到之后再linkerdin和其他大型公司都使用了kafka。我们注意到，在将kafka集成到数据管道中的时候，每个公司都必须解决的一些特定的挑战，因此我们决定向kafka 添加AP来解决其中的一些特定的挑战。而不是每个公司都需要从头开发。 kafka为数据管道提供的主要价值是它能够在管道的各个阶段之间充当一个非常大的，可靠的缓冲区，有效地解耦管道内数据的生产者和消费者。这种解耦，结合可靠性、安全性和效率，使kafka很适合大多数数据管道。

03

高效协作必备Autodesk Navisworks 2022 全版本软件下载安装教程

Autodesk Navisworks 2022是一款功能强大的BIM协作软件，它为用户提供了丰富的功能和工具，可帮助用户在建筑、土木工程等领域创建、编辑和分析3D模型，并进行多方数据协作。

02

Nature Methods | 单细胞基因组图谱数据集成的基准测试

本文介绍由德国计算生物学研究所的M. Colomé-Tatché和Fabian J. Theis共同通讯发表在 Nature Methods 的研究成果：作者对来自23篇出版物的85批基因表达、染色质可及性和模拟数据的68种方法和预处理组合进行了基准测试，总共代表了分布在13个图谱集成任务中的超过120万个细胞。作者使用14个评估指标，根据可伸缩性、可用性及其在保留生物变异的同时消除批次效应的能力对方法进行评估。研究表明，高度可变的基因选择提高了数据集成方法的性能，而数据缩放推动方法优先考虑批次去除而不是保留生物变异。总体而言，scANVI、Scanorama、scVI 和 scGen 表现良好，尤其是在复杂的集成任务上，而单细胞 ATAC 测序集成性能受特征空间选择的影响很大。该文免费提供的 Python 模块和基准测试管道可以为新数据确定最佳的数据集成方法，还能对新开发的方法进行基准测试。

01

MQTT Broker 白皮书：全面实用的 MQTT Broker 选型指南

在智能数字化时代，家居设备、工厂传感器、智能汽车、能源电力计量表等各类设备都已变身为新型的智能终端。为了满足这些海量且持续增长的智能设备之间对于实时、可靠的消息传递的需求，MQTT Broker 消息代理或消息中间件扮演了至关重要的角色。作为新一代数据接入的核心组件，MQTT Broker 负责在不同设备和服务之间进行可靠的消息传输、消息持久化、数据汇聚以及集成等关键功能，以满足各类智能应用场景中对实时、可靠消息通信的高标准要求。

01

从ETL走向EtLT架构，下一代数据集成平台Apache SeaTunnel核心设计思路解析

作者｜高俊编辑｜邓艳琴在今年 2 月份的 QCon 全球软件开发大会（北京站）上，Apache SeaTunnel PPMC Member 高俊分享了题为《EtLT 架构下的数据集成平台—Apache SeaTunnel》，本文由此整理，复制链接下载完整 PPT：https://qcon.infoq.cn/202302/beijing/presentation/5173 此次分享的主要内容分为 6 块，分别是—— 1. ETL 到 EtLT 架构演进 2. 数据集成领域的痛点 & 常见的解决方

01

基于 DTS 同步 MySQL 全增量数据至 CKafka，构建实时数仓的最佳实践

随着 IT 技术与大数据的不断发展，越来越多的企业开始意识到数据的价值，通过大数据分析，可以帮助企业更深入地了解用户需求、更好地洞察市场趋势。目前大数据分析在每个业务运营中都发挥着重要作用，成为企业提升市场竞争力的关键举措之一。通常企业会构建数据湖仓，将多个数据源通过数据集成技术，汇集一起进行数据分析。由此，数据集成成为了构建数据湖仓的必经之路，然而企业在数据集成过程中却面临很多棘手问题。

04

腾讯云数据库DTS发布全新数据集成方案：全增量无缝同步，快速构建实时数仓

随着IT技术与大数据的不断发展，越来越多的企业开始意识到数据的价值，通过大数据分析，可以帮助企业更深入地了解用户需求、更好地洞察市场趋势。目前大数据分析在每个业务运营中都发挥着重要作用，成为企业提升市场竞争力的关键举措之一。通常企业会构建数据湖仓，将多个数据源通过数据集成技术，汇集一起进行数据分析。由此，数据集成成为了构建数据湖仓的必经之路，然而企业在数据集成过程中却面临很多棘手问题。

01

iPaaS丨不同集成工具功能的重合性和相关性

当前企业集成工具主要有三大类：iPaaS、RPA、ETL 这三大类产品，这三大集成工具之间功能均有相互的交叉和重合，企业在进行集成类业务需求实现时，很多情况下会根据开发人员个人对工具的熟悉程度来选择其中的一个工具，而不是从企业总体集成管理规范和运维成本等方面全盘考虑后再做出正确的选择。当前不同集成工具的厂商都会扩展自己的功能边界并错误地引导企业的开发人员使用他们的工具去进行本不应该使用此集成工具去做的集成需求，这样往往会造成后续集成管理混乱，运维复杂，当集成出现问题时很难在原有平台上进行解决和扩展，最后不得不再迁移到其他集成工具上进行集成，浪费人力物力。所以开发人员要了解不同集成工具的定位和使用方式。

01

大数据平台最常用的30款开源工具

大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级，甚至是PB或EB级的数据，这是传统数据仓库工具无法处理完成的，其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等，汇集了当前IT领域热门流行的各类技术。

03

大数据工具指南：从选择到应用

通过部署和使用大数据分析工具，分析流程可以帮助公司提高运营效率，产生新的利润，获得竞争优势。企业可选择的数据分析应用程序有很多。比如描述性分析善于描述已发生的事情，揭示因果关系。描述性分析主要输出查询、报表和历史数据可视化。

02

开源ETL工具之Kettle介绍

Kettle是一个Java编写的ETL工具，主作者是Matt Casters，2003年就开始了这个项目，最新稳定版为7.1。 2005年12月，Kettle从2.1版本开始进入了开源领域，一直到4.1版本遵守LGPL协议，从4.2版本开始遵守Apache Licence 2.0协议。 Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为：Pentaho Data Integeration，简称“PDI”。自2017年9月20日起，Pentaho已经被合并于日立集团下的新公司： Hitachi Vantara。总之，Kettle可以简化数据仓库的创建，更新和维护，使用Kettle可以构建一套开源的ETL解决方案。

01

EMQX vs NanoMQ | 2023 MQTT Broker 对比

EMQX 和 NanoMQ 都是由全球领先的开源物联网数据基础设施软件供应商 EMQ 开发的开源 MQTT Broker。

05

数据导入与预处理-第6章-01数据集成

数据分析中需要的数据往往来自不同的途径，这些数据的格式、特点、质量千差万别，给数据分析或挖掘增加了难度。为提高数据分析的效率，多个数据源的数据需要合并到一个数据源，形成一致的数据存储，这一过程就是数据集成。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭