小剧场同事小王:Superset 是不是只能连常见的 MySQL、PostgreSQL? 同事小李:错!Doris 一样能连,还超简单——听我三分钟教你上线!
心动不如行动,今天就带大家看——如何用 Apache Superset 快速连接 Apache Doris,实现 BI 可视化!
视频教程:
二者组合,就是「海量数据 + 极速查询 + 丰富可视化」三位一体,秒变数据驾驶舱!
就像盖楼要打地基,我们先来准备好 Superset 的运行环境。
创建并激活 Python 虚拟环境(推荐!保持环境纯净):
# 新建虚拟环境
pyenv virtualenv superset
# 进入环境
pyenv activate superset
小提示:拥有一个独立的虚拟环境,能避免不同项目间的包冲突哦!
升级 PIP 到最新版:
# 升级PIP
pip install --upgrade pip
安装 pydoris
驱动:这是 Superset 连接 Doris 的“桥梁”。
# 安装 pydoris
pip install pydoris
安装 apache-superset:主角登场!
# 安装 superset
pip install apache-superset
配置环境变量:
# 设置 SUPERSET_SECRET_KEY (可自定义)
export SUPERSET_SECRET_KEY="a_very_strong_secret_key_123456"
# 设置 FLASK_APP
export FLASK_APP="superset"
安全第一!SUPERSET_SECRET_KEY
一定要设置得复杂些哦!
(重要步骤,根据视频)安装特定版本的 marshmallow:
# 安装特定 marshmallow 版本以确保兼容性
pip install marshmallow==3.2.1
视频中提到,特定版本的 Superset 可能需要特定版本的 marshmallow。请注意,较新版本的 Superset 可能有不同的依赖管理方式,建议查阅 Superset 官方文档获取最新信息。
环境就绪,让我们唤醒 Superset!
创建管理员账户:
# 创建 admin 用户
superset fab create-admin
按照提示设置用户名 (e.g., admin
)、姓氏、名字、邮箱和密码。如果提示用户已存在,说明你之前可能创建过啦!
初始化数据库和 Superset:
# 初始化superset
superset init
耐心等待一小会儿,让 Superset 完成它的魔法变身!✨
启动 Superset 服务:
# 启动 superset,指定端口和允许所有IP访问
superset run -p 8088 --with-threads --reload --debugger -h 0.0.0.0
这里我们指定了 8088
端口,并允许所有 IP (0.0.0.0
) 访问,开启了 debug
模式方便测试。
访问 Superset UI: 打开浏览器,输入 http://<你的服务器IP>:8088
。如果一切顺利,你就能看到 Superset 的登录界面啦!用刚才创建的管理员账户登录。
在浏览器输入:http://<你的服务器IP>:8088
,登录你的 Superset 管理账号。
在左侧菜单选择 “数据” → “数据库” → “+ 添加”
Supported Databases 选 Apache Doris
SQLAlchemy URI 填入:
doris://<User>:<Password>@<Host>:<Port>/<Catalog>.<Database>
例如:
doris://root:123456@127.0.0.1:9030/internal.SSB
点击 “测试连接”,看到 “连接成功” 就 OK 了。
从今天起,你只需几分钟,就能把 Doris 里的海量数据秒级可视化,真正做到「看得见、改得了、管得住」。赶快动手,用 Superset 点亮你的 Doris 数据吧!✨