一、概述
Presto是Facebook开源的MPP(Massively Parallel Processing:大规模并行处理)架构的OLAP(on-line transaction processing:联机事务处理),完全基于内存的并⾏计算,可针对不同数据源,执行大容量数据集的一款分布式SQL交互式查询引擎。它是为了解决Hive的MapReduce模型太慢以及不能通过BI或Dashboards直接展现HDFS数据等问题。
但是Presto目前有两大分支:和PrestoSQL现在改名为,虽然PrestoDB背靠Facebook,但是社区活跃度和使用群体还是远不如Trino。所以这里以Trino为主展开讲解。
PrestoDB官方文档:https://prestodb.io/docs/current/
Trino官方文档:https://trino.io/docs/current/
地址:https://artifacthub.io/packages/helm/trino/trino
1)添加源并下载编排部署包
2)构建镜像
Dockerfile
【温馨提示】这里jdk只能使用jdk17,其它版本暂时是不支持的。
开始构建镜像
3)修改配置
这里只加了hive和mysql catalog,小伙伴可以自行添加其它catalog就行。
4)开始部署
NOTES
web 地址:http://192.168.182.110:31080/
用户任意值
5)测试验证
1、mysql catalog 测试
2、hive catalog 测试
在 Hive 中创建数据库、数据表和数据
在presto中查询
【温馨提示】不建议在presto中创建库表,一般presto只是作为查询引擎。
6)卸载
git下载地址:https://gitee.com/hadoop-bigdata/presto-on-k8s
领取专属 10元无门槛券
私享最新 技术干货