首页
学习
活动
专区
圈层
工具
发布

#hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

Spark中DataFrame写入Hive表时的Schema不匹配问题排查与解决

用魔法才能打败魔法

Spark中DataFrame写入Hive表时的Schema不匹配问题排查与解决

8710

踩坑经验 | Hive除法小数位问题

做数据的二号姬

最近在写一个Hive SQL的时候遇到了除法结果不对的问题。大概就是sum(a)/sum(b)明明不等于0但是SQL返回的结果是0的问题。

12010

【hive聚合函数多行合并 】

用户1750537

在Hive中,多行合并聚合函数的主要作用是将多行数据按照一定的条件合并成一行。这在处理大量数据时非常有用,可以减少数据的存储和计算开销。Hive提供了一些内置的...

7010

深入解析Hive SQL转MapReduce的编译原理:从AST抽象语法树到Operator执行树

用户6320865

解决方案包括:使用FUNCTION关键字显式声明返回类型;对于复杂数据类型,实现GenericUDF接口比直接继承UDF更可靠;通过hive.session.i...

14110

高级SQL优化 | PawSQL破解Hive无分组聚合的数据倾斜难题 —— 千亿级数据量下的优化方案

PawSQL

大数据工程师的经典痛点当你在Hive中执行 SELECT MAX(salary) FROM 10B_table时,是否经历过单Reducer卡死数小时?无分组的...

8910

Hive 大表全局排序如何优雅加速?PawSQL 让 ORDER BY + LIMIT 性能提升256倍

PawSQL

在大数据处理框架中,ORDER BY + LIMIT 是一个常见的“性能杀手”组合。全局排序操作往往意味着数据汇总、单点瓶颈与严重的数据倾斜。为了应对这一典型问...

9710

PawSQL 推出 Hive 专版,助力大数据团队提升SQL审核和SQL优化能力

PawSQL

场景一: 凌晨2点,数据工程师小王还在办公室调试一条跑了3小时的Hive查询...

14810

大数据工程师必读:Hive性能优化的18条黄金法则 —— PawSQL for Hive 优化引擎揭秘

PawSQL

表结构优化规则主要针对Hive环境下的DDL最佳实践,涵盖了表结构设计、数据类型选择、命名规范和约束定义等方面;本文将详细介绍其中的存储格式、分区分桶、压缩算法...

26910

大数据工程师必读:Hive 优化的四大维度——从三小时到三分钟的性能进阶之路

PawSQL

核心思想:如果两个大表的关联字段都进行了相同规则的分桶,并且桶数量匹配(一般为对方桶数量的倍数),Hive 在 Join 时可以避免对所有数据进行全量 Shuf...

25210

Hive性能优化进阶 —— 五大Join策略深度解析与实践指南(PawSQL for Hive 理论基础之二)

PawSQL

触发条件: 当没有其他优化条件被满足时(例如,表太大无法Map Join,或者没有分桶无法SMB Join),Hive会自动选择Common Join。也可通过...

29710

Hive 数据同步到 Doris 最佳实践方案:从场景适配到性能调优全解析

数据极客圈

在大数据领域,Hive 作为成熟的数据仓库解决方案,常用于海量数据存储与离线处理,而 Doris 凭借其强大的 OLAP 能力,在实时分析、即席查询等场景表现卓...

32310

大数据工程师必读:Hive性能优化第一步——正确认识Hive的三大执行引擎

PawSQL

PawSQL for Hive 理论基础之二:执行引擎是Hive SQL的“心脏”,负责将SQL语句转化为物理任务并在集群上高效执行。它的选择,直接决定了你的S...

21700

spark 操作 hive

码农GT038527

参考该文章:https://cloud.tencent.com/developer/article/2443534

13110

安装hue及hadoop和hive整合

IT咸鱼

https://dl.dropboxusercontent.com/u/730827/hue/releases/3.10.0/hue-3.10.0.tgz

15600

Mac系统下安装hive

IT咸鱼

在安装hive之前需要安装hadoop,因为hive本身并没有提供数据存储功能。它的数据是存储在hadoop的HDFS上面的。安装hadoop的方法见上面的链接...

17400

【SQL 周周练】一千条数据需要做一天,怎么用 SQL 处理电表数据(如何动态构造自然月)

蒋点数分

大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。

22910

【SQL 周周练】爬取短视频发现数据缺失,如何用 SQL 填充

蒋点数分

大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。

26021

【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?

蒋点数分

大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。

15501

【SQL周周练】给你无酸纸、变色油墨,你能伪造多少美金?

蒋点数分

大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。

12810

【Uber 面试真题】SQL :每个星期连续5星评价最多的司机

蒋点数分

大家好,我是“蒋点数分”,多年以来一直从事数据分析工作。从今天开始,与大家持续分享关于数据分析的学习内容。

27110
领券