首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我们可以在HDP 3中安装Apache Falcon吗?

在 HDP 3(Hortonworks Data Platform 3.x)中,Apache Falcon 已经被弃用,不再作为默认组件提供。Hortonworks 在 HDP 3 中推荐使用 Apache NiFi 和 Apache Atlas 作为替代方案来实现数据流和数据治理功能。

为什么不再支持 Apache Falcon?

  1. 功能重叠: Apache NiFi 提供了更强大和灵活的数据流管理功能,而 Apache Atlas 提供了更全面的数据治理和元数据管理功能。
  2. 社区支持: Apache Falcon 的社区支持和开发活动已经减少,Hortonworks 选择了更活跃和功能更强大的项目来替代 Falcon。

替代方案

  1. Apache NiFi: 用于数据流管理和编排。它提供了一个基于 Web 的用户界面,可以轻松地设计、管理和监控数据流。
  2. Apache Atlas: 用于数据治理和元数据管理。它提供了数据分类、数据血缘、数据安全和合规性管理等功能。

如何在 HDP 3 中使用 Apache NiFi 和 Apache Atlas

安装 Apache NiFi

  1. 通过 Ambari 安装:
    • 打开 Ambari 管理界面。
    • 导航到 Add Service
    • 选择 NiFi 并按照向导完成安装。
  2. 手动安装:
    • 下载 Apache NiFi 的二进制文件。
    • 解压缩并配置 nifi.properties 文件。
    • 启动 NiFi 服务。

安装 Apache Atlas

  1. 通过 Ambari 安装:
    • 打开 Ambari 管理界面。
    • 导航到 Add Service
    • 选择 Atlas 并按照向导完成安装。
  2. 手动安装:
    • 下载 Apache Atlas 的二进制文件。
    • 解压缩并配置 atlas-application.properties 文件。
    • 启动 Atlas 服务。

使用 Apache NiFi 和 Apache Atlas

  1. Apache NiFi:
    • 打开 NiFi 的 Web UI(默认端口为 8080)。
    • 使用拖放界面设计数据流。
    • 配置处理器、连接器和其他组件来管理数据流。
  2. Apache Atlas:
    • 打开 Atlas 的 Web UI(默认端口为 21000)。
    • 使用 Atlas 提供的 API 或 UI 来管理元数据。
    • 配置数据分类、数据血缘和其他数据治理功能。

结论

虽然在 HDP 3 中不再支持 Apache Falcon,但你可以使用 Apache NiFi 和 Apache Atlas 来实现类似的功能。这些工具提供了更强大和灵活的功能,可以更好地满足现代数据流和数据治理的需求。如果你仍然需要使用 Apache Falcon,可以考虑在独立环境中安装和配置,但这不推荐用于生产环境。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 0480-如何从HDP2.6.5原地迁移到CDH5.16.1

    我们常使用的Hadoop平台包括Apache Hadoop,CDH和HDP,有时我们会碰到需要迁移平台的情况,举个例子,比如你已经一直在使用Apache Hadoop2.4,近期看到CDH6附带Hadoop3发布了,想迁移到CDH并且做整个平台的所有组件升级。平台迁移和平台升级的方式基本一样的,一般有2种大的选择,第一种是原地升级即直接在原有平台上操作,该办法操作效率较高,马上看到效果,但往往风险较高,比如升级失败回滚方案不完善,跨大版本比如Hadoop2到Hadoop3可能HDFS还有丢数据的风险;第二种是拷贝数据的方式升级,需要额外的服务器资源,会新搭平台,然后把旧的平台的数据拷贝过去,数据拷贝完毕后,再把旧集群的机器下线了慢慢加入到新集群,该方法一般实施周期较长,但是风险较小。根据实际情况可以选择不同的方式来进行平台迁移或者平升级,另外对于两种方案还可以具体细化分类出不同的方案,比如第一种方案考虑提前备份数据或者备份关键数据等,本文Fayson不做细化讨论。

    04

    Ganglia在CentOS 6.5的安装

    一.Ganglia概述 Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。(来自百度百科) 二.前期工作EPEL的安装 EPEL(Extra Packages for Enterprise Linux),这是针对RHEL设计的软件仓库,在这个仓库中有很多免费的常用软件,由Fedora项目维护,如果使用的是RHEL,CentOS,Scientific等RHEL系列的linux,可以非常方便的使用EPEL的yum源。 查看本机是否安装了EPEL: rpm -q epel-release package epel-release is not installed 如果没有安装,可以选择下面的情况来安装: 32位系统选择: rpm -ivh http://download.fedora.RedHat.com/pub/epel/6/i386/epel-release-6-8.noarch.rpm 64位系统选择: rpm -ivh http://download.fedora.redhat.com/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm 导入key: rpm --import /etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6 安装后可以查看,得到: rpm -q epel-release epel-release-6-8.noarch 三.ganglia的安装 目前集群有三个节点:hdp1,hdp2,hdp3,其中hdp1为主节点 1.服务端安装 在服务器中需要安装 yum -y install ganglia 2.客户端安装 在客户端中需要安装 yum -y install ganglia-gmond 四.ganglia的配置 1.服务端配置 在/etc/ganglia/gmetad.conf中进行下面的配置 data_source "ShaQi" hdp1 hdp2 hdp3 setuid_username "apache" (可以不设置) 2.客户端配置 在/etc/ganglia/gmond.conf中进行下面的配置 cluster {   name = "ShaQi"   owner = "apache"   latlong = "unspecified"   url = "unspecified" } 其中name需要与gmetad.conf中data_source中的“ShaQi”匹配 owner需要与setuid_username中的值对应(如果没有设置,可以不用修改) 修改了setuid_username后需要对权限进行更改: Chown -R apache:apache /var/lib/ganglia/rrds 否则使用service gmetad status时出现gmetad dead but subsys locked 3.Apache的服务端配置 /etc/httpd/conf.d/ganglia.conf 代码如下: Alias /ganglia /usr/share/ganglia <Location /ganglia> Order deny,allow Allow from all </Location> 五.ganglia的启动 启动服务端gmetad并且设为开机启动 service gmetad start  chkconfig gmetad on 通过telnet localhost 8651进行测试 启动客户端的gmond并设为开机启动 service gmond start chkconfig gmond on 通过telnet localhost 8649进行测试 启动apache服务端 service httpd restart 六.ganglia的测试 通过浏览器访问:http://service_ip/ganglia加载下面界面

    01
    领券