
🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。
摘要: 本文档介绍如何在Linux服务器上部署Airflow服务,与openmetadata进行集成,后在openmetadata系统中实现对Airflow工作流数据的拾取以及数据库元数据的拾取。
• openmetadata:1.6.0
• airflow:2.9.1

元数据管理平台基于开源项目OpenMetaData建设
元数据管理平台OpenMetaData通过全面的元数据采集、强大的存储与检索、深度的分析与治理、灵活的应用与共享、高扩展性与定制化以及直观的用户体验,为企业提供了一站式的元数据管理解决方案。
1.1 Minicoonda
1.1.1 安装








1.1.2 查看环境

1.1.3 创建虚拟环境

1.1.4 删除虚拟环境

1.1.5 激活虚拟环境

1.1.6 退出虚拟环境

1.2 JDK

2.1 设置环境变量

2.2 创建虚拟环境


2.3 安装



2.4 修改配置

2.4.1 airflow webserver端口






2.4.4 auth_backends


2.5 初始化数据库


2.6 安装插件

2.7 启动airflow



3.1 进入openmetadata页面

3.2 点击服务
点击后,进入以下页面

3.3 点击工作流
点击后,进入以下页面

3.4 点击添加新服务

3.5 点击下一步

3.6 点击下一步





3.7 点击添加拾取


3.8 点击下一步

3.9 点击添加部署

3.10 点击查看服务

3.11 点击提取

3.12 登录Airflow

4.1 进入openmetadata页面

4.2 点击服务
点击后,进入以下页面

4.3 点击数据库
点击后,进入以下页面

4.4 点击添加新服务

4.5 点击下一步

4.6 点击下一步



4.7 点击添加提取

4.8 点击下一步

4.9 点击添加部署

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。