前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >StarRocks 开发环境搭建踩坑指北

StarRocks 开发环境搭建踩坑指北

原创
作者头像
crossoverJie
发布2024-10-11 09:53:35
1060
发布2024-10-11 09:53:35
举报
文章被收录于专栏:crossoverJie

背景

最近这段时间在处理一个 StarRocks 的关于物化视图优化的一个问题,在此之前其实我也没有接触过 StarRocks 这类主要处理数据分析的数据库,就更别提在这上面做优化了。

在解决问题之前我先花了一两天时间熟悉了一下 StarRocks 的一些概念和使用方法,然后又花了一些时间搭建环境然后复现了该问题。

之后便开始阅读源码,大概知道了相关代码的执行流程,但即便是反复阅读了多次代码也没有找到具体出现问题的地方。

所以便考虑在本地 Debug 源码,最终调试半天之后知道了问题所以,也做了相关修改,给社区提交了 PR,目前还在推进过程中。

环境搭建

这里比较麻烦的是如何在本地 debug 代码。

根据官方的架构图会发现 StarRocks 主要分为两个部分:

  • FE:也就是常说的前端部分,主要负责元数据管理和构建执行计划。
  • BE:后端存储部分,执行查询计划并存储数据。

其中 FE 是 Java 写的,而存储的 BE 则是 C++ 写的,我这次需要修改的是 FE 前端的部分,所以本篇文章主要讨论的是 FE 相关的内容。

好在社区已经有关于如何编译和构建源码的教程,这里我列举一些重点,FE 首先需要安装以下一些工具:

  • Thrift
  • Protobuf
  • Python3
  • JDK8+
代码语言:bash
复制
brew install alberttwong/thrift/thrift@0.13
$ thrift -version  
Thrift version 0.13.0

brew install protobuf

以上默认是在 Mac 平台上安装的流程,所以全程使用 brew 最方便了,如果是其他平台也是同理,只要安装好这些工具即可。

紧接着便是编译 FE,我们需要先下载源码,然后进入 FE 的目录:

代码语言:bash
复制
git clone https://github.com/StarRocks/starrocks.git
cd fe
mvn install -DskipTests

然后直接使用 maven 编译安装即可。

这里需要注意⚠️,因为编译过程中需要使用 Python3 来执行一些构建任务,新版本的 Mac 都是内置 Python3 的,但如果是老版本的 Mac 内置的则是 Python2。

这时就需要我们将 Python3 的命令手动在构建任务里指定一下:

比如我这里的 Python3 命令为 python3

我们需要在 fe/fe-core/pom.xml 目录里修改下 Python 的命令名称:

修改之后再 mvn install 编译一次,如果一切顺利的话便会编译成功。

搭建本地集群

启动 FE

我的最终目的是可以在本地 IDEA 中启动 FE 然后再配合启动一个 BE,这样就可以在 IDEA 中调试 FE 的源码了。

在启动 FE 之前还需要创建一些目录:

代码语言:bash
复制
cp -r conf fe/conf
cp -r bin fe/bin
cp -r webroot fe/webroot

cd fe  
mkdir log  
mkdir meta

主要就是要在 FE 的目录下创建配置文件、执行脚本、日志、元数据等目录。

接着便可以打开 com.starrocks.StarRocksFE 类在 IDEA 中运行了,在启动之前还需要配置一下环境变量:

代码语言:bash
复制
# 修改为自己的目录
export PID_DIR=/Users/smith/Code/starrocks/fe/bin
export STARROCKS_HOME=/Users/smith/Code/starrocks/fe
export LOG_DIR=/Users/smith/Code/starrocks/fe/log

同时需要配置下 fe.conf 中的 priority_networks 网络配置:

代码语言:conf
复制
priority_networks = 10.10.10.0/24

这个 IP 得是宿主机的 IP,后续我们使用 docker 启动 BE 的时候也需要用到。

如果启动失败,可以在日志目录下查看日志:

代码语言:bash
复制
2024-09-16 21:21:59.942+08:00 ERROR (main|1) [NodeMgr.getCheckedSelfHostPort():642] edit_log_port 9010 is already in use. will exit.

碰到这个异常:提示端口被占用,那可以尝试关闭代理之后再试试。

启动成功后我们便可以使用 MySQL 兼容的客户端进行连接了,这里我使用的是 tableplus:

然后我们使用以下 sql 可以查询 fe 的节点状态:

代码语言:sql
复制
SHOW PROC '/frontends';

看到类似的输出则代表启动成功了。

启动 BE

之后我们便可以使用 Docker 来启动 BE 了,之所以用 docker 启动,是因为 BE 是 C++ 编写的,想要在 Mac 上运行比较麻烦,最好是得有一台 Ubuntu22 的虚拟机。

如果我们不需要调试 BE 的话,只使用 docker 启动是再合适不过了。

代码语言:bash
复制
docker run -p 9060:9060 -p 8040:8040 -p 9050:9050 -p 8060:8060 -p 9070:9070 -itd --rm --name be -e "TZ=Asia/Shanghai" starrocks/be-ubuntu

我们需要将 FE 需要连接 BE 的端口暴露出来,启动成功后该镜像并不会直接启动 BE,我们需要进入容器手动启动。

代码语言:bash
复制
docker exec -it be bash

在启动之前我们依然需要修改下 be.conf 中的 priority_networks 配置:

修改为和 fe.conf 中相同的配置。

之后使用以下命令启动 be:

代码语言:bash
复制
bin/start_be.sh --daemon

启动日志我们可以在 logs 目录中查看。

绑定 FE 和 BE

接下来还有最后一步就是将 FE 和 BE 绑定在一起。

我们在 fe 中执行以下 sql:

代码语言:sql
复制
ALTER SYSTEM ADD BACKEND "127.0.0.1:9050";

手动添加一个节点,之后再使用:

代码语言:sql
复制
SHOW PROC '/backends';

可以查询到 BE 的节点状态:

如果出现以下结果代表连接成功,这样我们就可以创建数据库和表了。

总结

这部分内容(本地 FE 联结 docker 里的 FE)官方文档并没有提及,也是我踩了不少坑、同时还咨询了一些大佬才全部调试成功。

还有一点需要注意的事:如果我们网络环境发生了变化,比如从家里的 Wi-Fi 切换到了公司的,需要手动删除下 FE/meta 下的所有文件再次启动,BE 则是需要重启一下容器。

参考链接:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景
  • 环境搭建
    • 搭建本地集群
      • 启动 FE
      • 启动 BE
      • 绑定 FE 和 BE
  • 总结
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档