前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hive性能优化

Hive性能优化

作者头像
十里桃花舞丶
发布2021-09-10 11:15:16
5700
发布2021-09-10 11:15:16
举报
文章被收录于专栏:桥路_大数据

性能优化

作业调优

严格模式

Hive在执行SQL命令时,可以设置严格模式,防止用户执行一些对性能影响很大的查询。

代码语言:javascript
复制
set hive.mapred.mode=strict;

在Hive 2.x之前默认为nonstrict,之后默认是strict。

严格模式禁止对分区表进行全表扫描,查询时在where语句中必须包含分区字段限制范围。对使用了Order By的查询,必须使用limit语句限制数据量,防止单任务运行时间过长。

严格模式下,会限制笛卡尔积的查询。

在企业,可以进行灵活设置,但严格模式的开启,可能会导致某些SQL语句无法执行。

基本属性

为作业配置作业名,便于查找:

代码语言:javascript
复制
set mapred.job.name=my_job_{DATE};

对于紧急作业,可以提高作业优先级,以增加处理时的响应速度:

代码语言:javascript
复制
--5个优先级可选:VERY_HIGH,HIGH,NORMAL,LOW,VERY_LOW
set mapred.job.priority=VERY_HIGH;

并发控制

为作业设置并行处理,对于非严格依赖的任务,进行并发运算。并行处理开启后,并不会增加Map数、Reduce数,而是将没有严格先后依赖

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/08/18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 性能优化
    • 作业调优
      • 严格模式
      • 基本属性
      • 并发控制
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档