hive优化 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

配置单元: with multi insert查询: FAILED:不应发生SemanticException

、

我为了优化的目的使用多插入查询，当然它对我有很大的帮助，但随着每天的运行，我可以找到3到4个id(计数超过1000万)，在reducer上花费了太多的时间。为了解决这个问题，我实现了skewjoin优化属性，但是它抛出了我正在使用的属性set hive.exec.compress.intermediate=true; set

浏览 1提问于2016-08-18得票数 0

1回答

hive将StringObjectInspector转换为字符串

、、、、

我正在编写通用的UDF。如果我直接使用UDF，它就能工作，但是如果我将UDF与其他函数(distinct，max，min)一起使用，它甚至都不会调用evaluate函数。码publ

浏览 3提问于2020-06-03得票数 0

1回答

有人能解释一下吗："Spark支持与Hive不同的用例。“

、、、

我指的是以下链接： Hive是使用星火优化器还是构建自己的优化器？

浏览 4提问于2014-08-27得票数 1

回答已采纳

1回答

hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？

、、、

根据蜂巢模板：但我不明白hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？

浏览 0提问于2018-02-12得票数 2

回答已采纳

1回答

我正在运行一个类似于tableA left on tableA.col1=tableB.col1和tableA.col2=tableB.col2的蜂巢查询。tableA有18亿个数据，tableB有3100万个记录。现在，我加入的最后一个减速器还没有完成，而且还在运行很长时间。我能看到长时间运行的任务如下所示 reduce > copy task(attempt_1498868574233_185232_m_001336_0 succeeded at 8.94

浏览 2提问于2017-07-07得票数 1

1回答

在regexp_like中组合like和not like以优化亚马逊雅典娜中的配置单元查询

、

我需要以一种优化的方式重写hive查询。AND info LIKE '%page-type=Faceout%' AND info NOT LIKE '%page-type=FaceoutRAW%' 雅典娜文档说我们可以优化hive查询。有人能帮我写一个更优化的查询吗？此查询超时(超过30分钟)

浏览 52提问于2018-02-14得票数 1

1回答

如何在hadoop中执行配置单元查询

、、、、

我想知道像Hadoop这样的分布式系统是如何执行hive查询的。我已经检查了其他问题，但都没有详细解释。任何知道hive执行过程的人，请解释一下。

浏览 2提问于2017-03-27得票数 1

1回答

Hive中的查询性能问题

、、

我在“蜂巢表”里有1.2亿张唱片。在执行带有某些select条件的where语句或执行任何avg时，max(mathematical operation)查询需要2至3个小时执行。我是不是漏掉了蜂巢的配置。因为这个查询花费了这么多时间，这似乎很不寻常。我使用的是微软Azure服务上的Hortonworks 2.5沙箱。

浏览 4提问于2017-03-16得票数 1

1回答

无法在hive* 0.12中使用桶映射连接*

、、

我尝试了一些蜂箱优化特性，并遇到了这样的问题:我不能在hive0.12中使用桶映射连接。在我尝试了下面的所有设置之后，只生成了一个哈希表文件，并且这个连接结果只是映射连接。> set hive.enforce.bucketing=true;hive> insert> set hive.auto.convert.join=true; hive</e

浏览 2提问于2014-03-24得票数 0

回答已采纳

1回答

使用hive优化hive数据聚合

、、、、

我有一个带有followig模式(event_id，country，unit_id，date)的hive表(8,000,000条记录)，我需要将这些数据导出到一个文本文件中，满足以下要求:1- event_id

浏览 6提问于2017-05-05得票数 0

1回答

配置单元事务性表压缩失败

、

Job commit failed: java.io.FileNotFoundException: File hdfs://hadoop1.openstacksetup.com:8020/apps/hiveorg.apache.hadoop.hdfs.DistributedFileSystem.listStatus(DistributedFileSystem.java:962) at org.apache.hadoop.hive.ql.txn.compactor.CompactorMRinitiate compacti

浏览 2提问于2016-10-25得票数 0

1回答

Hive与Parquet文件上的星火数据集

、、

对于相同的数据，我有两个实例。 val myCoolDataSet = spark .select("col1", "col2") .filter(x => x.col1 == "Dummy")val myCoolDataSet = spark .parquet("

浏览 0提问于2018-07-05得票数 4

回答已采纳

1回答

蜂巢性能调优

、

我已经找到了九个最重要的参数，它们将有助于优化hive的性能。它们如下(没有具体的顺序)：

浏览 3提问于2017-07-17得票数 0

1回答

Presto Hive分区感知吗？

、

Presto如何处理Hive分区？它能在查询执行过程中识别分区吗？在使用分区处理hive表时，我们遇到了性能问题。

浏览 1提问于2013-11-25得票数 4

2回答

在Hive中所有推荐的优化技术是什么？

、、、

嗯，我知道一些优化技术，比如分区和编写查询时的桶。在TEZ模式下运行蜂箱。但是，除此之外，还有其他优化技术存在于蜂箱中。

浏览 2提问于2016-06-06得票数 0

回答已采纳

1回答

合唱团表演中的蜂巢大战猪

、、、

我已经将这些数据加载到Hive中的多个表中。我每天运行这些脚本来分析流量。最近，我发现我在这些脚本中编写的蜂巢查询花费了太多的时间。我的一个朋友建议我，当涉及到加入多个蜂箱表时，Hive是不好的，我应该将我的脚本转换为Pig。与猪相比，蜂巢在加入餐桌方面有问题吗？

浏览 1提问于2013-01-10得票数 1

1回答

测试Hive数组的IS表示NULL

、、

我有一个包含数组的表，我想检查它是空的还是空的。看来我不能直接检查NULL！有人能解释一下为什么空检查不起作用吗？( `campaign` string) `campaign`, size(`questions`) , case when `q

浏览 0提问于2020-07-24得票数 0

2回答

带蜂巢表的spark.sql.cbo.enabled=true

、

在Spark2.2中，基于成本的优化器选项已经启用。文档似乎是说，在启用此选项之前，我们需要分析Spark中的表。我想知道，当我们将来自Hive的所有表数据作为数据存储层时，这个选项是否有用。由于spark将使用Hivetablescan (避免映射/减少)读取Hive，所以在从Hive读取数据时使用CBO配置是否有意义。

浏览 4提问于2018-08-28得票数 2

回答已采纳

1回答

Hive优化自连接

、、

假设我有以下查询： from cars) a from cars) b 我在这里重复一个子查询。我只是想知道下面的方法是更“最佳”，还是会自动缓存重复的子查询结果？ with f

浏览 2提问于2014-11-01得票数 1

1回答

配置单元中具有Join或Where子句的条件

、

我想了解hive是如何执行这两个查询的。我们在Hive中有没有查询优化器？

浏览 2提问于2015-09-15得票数 2

点击加载更多

配置单元: with multi insert查询: FAILED:不应发生SemanticException

hive将StringObjectInspector转换为字符串

有人能解释一下吗："Spark支持与Hive不同的用例。“

hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？

扭曲数据，导致在蜂箱中长时间运行查询

在regexp_like中组合like和not like以优化亚马逊雅典娜中的配置单元查询

如何在hadoop中执行配置单元查询

Hive中的查询性能问题

无法在hive* 0.12中使用桶映射连接*

使用hive优化hive数据聚合

配置单元事务性表压缩失败

Hive与Parquet文件上的星火数据集

蜂巢性能调优

Presto Hive分区感知吗？

在Hive中所有推荐的优化技术是什么？

合唱团表演中的蜂巢大战猪

测试Hive数组的IS表示NULL

带蜂巢表的spark.sql.cbo.enabled=true

Hive优化自连接

配置单元中具有Join或Where子句的条件

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐