腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
与Oracle相比,在Hadoop中对表使用
索引
有什么优势吗?
、
、
、
、
我需要比较一下Oracle和Hadoop(
Hive
)中的
索引
。到目前为止,我可以在
Hive
中找到两种主要的
索引
技术,即紧凑
索引
和位图
索引
。我可以查看与Oracle相比,
Hive
中紧凑
索引
的性能差异。我需要了解更多在
Hive
中使用位图
索引
的用例/场景。此外,需要知道
Hive
是否支持反向键
索引
,升序和降序
索引
,如Oracle。
浏览 1
提问于2016-12-27
得票数 1
1
回答
蜂巢查询语言中的主键和
索引
是否是可接受的?
、
、
、
、
我们正在尝试迁移甲骨文表,以保存和处理它们。目前,oracle中的表具有primary key、foreign key和unique key约束。我们正在对如何实施它做一些分析。
浏览 1
提问于2019-07-05
得票数 1
1
回答
Hive
(Bigdata)-存储和
索引
之间的区别
、
、
、
在蜂巢中,查表和
索引
的主要区别是什么?
浏览 2
提问于2015-06-13
得票数 2
回答已采纳
2
回答
Apache对ORC文件格式的支持
、
、
、
我想在SolrCloud集合中
索引
它们的
数据
。 是否支持以Solr格式存储ORC格式的
数据
索引
?我在谷歌上搜索过但什么都没出来。
浏览 3
提问于2017-02-20
得票数 0
回答已采纳
1
回答
组:无法填写
索引
、
、
、
我正在使用
Hive
14.0,并且对
索引
表有一个挑战。如果我想在没有延迟重建的情况下构建一个
索引
,
Hive
不会为我创建一个
索引
表。CREATE INDEX ix_test ON TABLE testtable(myKey) as 'org.apache.hadoop.
hive
.ql.index.compact.CompactIndexHandlerCREATE INDEX ix_test ON TABLE testtable(myKey) as 'org.apache.
浏览 3
提问于2015-05-06
得票数 0
回答已采纳
1
回答
与PostgreSQL相比,配置单元
索引
重建速度太慢
、
我正在尝试比较我的PostgreSQL
数据
仓库和新创建的
Hive
数据
仓库上的相同功能,它们位于具有相同
数据
和相同表结构的相同盒子上。我在试着理解蜂巢福利,但是...尽管
数据
加载到PostgreSQL的速度慢了3倍- PostgreSQL上的
索引
创建/重建速度快了20倍,但不需要像在
Hive
中那样每次都重建
索引
。‘/ 'org.apache.hadoop.
hive
.ql.index.compact.Comp
浏览 1
提问于2013-03-21
得票数 0
1
回答
特兹。慢速减速器
、
我试图从
Hive
读取日志
数据
,将其按id、日期和其他参数分成若干块,然后写入另一个单元表。Map阶段的工作速度足够快,大约需要20分钟,比减速机开始工作要快得多,458台减速器中的453台在接下来的20分钟内处理所有
数据
。但是最后5个减速器工作了大约一个小时。这是因为我的输入
数据
包含了一些巨大的条目,处理这些条目需要花费大量的时间。这类案件的最佳做法是什么?我应该对hadoop/tez/
hive
进行一些调优,以允许对最后一个还原器进行类似的并行处理,还是将输入
数据
拆分
浏览 3
提问于2016-02-15
得票数 1
1
回答
Hive
-如何在内部执行多个大表连接查询(在MapReduce中),以及如何对其进行优化?
、
、
假设我有4-5个
大
表(以to为单位的
数据
),我想在
hive
中加入它们。
Hive
在内部(在MapReduce中)执行joins的效果如何?
浏览 1
提问于2018-06-27
得票数 1
1
回答
Elasticsearch和
Hive
协同工作
、
、
、
我看到,除了Elasticsearch支持接近实时的查询之外,
Hive
和Elasticsearch几乎是等价的。此外,Elasticsearch可以独立运行来存储和分析
数据
。那么为什么人们在Hadoop上同时使用
Hive
和Elasticsearch呢?
浏览 0
提问于2014-08-31
得票数 0
1
回答
支持以
HIVE
ORC格式编制
索引
、
、
、
我们希望部署一个报告解决方案,其中
数据
存储在
HIVE
/Hadoop
数据
层中,该
数据
层将由报告层使用SSRS查询。现在考虑到性能优化,考虑到在
数据
层上使用
索引
是否有意义,因为我们将在
HIVE
上使用ORC文件格式。 根据下面这样的几个引用,看起来
索引
是ORC文件格式固有的吗?是这种情况还是这是另一回事。我对
HIVE
/Hadoop还不熟悉,所以我很感谢这里的任何指点。谢谢!
浏览 1
提问于2017-06-13
得票数 0
2
回答
es (ElasticSearch- Hadoop )是如何实现Hadoop的?
、
、
如果它仅仅是HDFS的Hadoop连接器,那么es-hadoop如何启用Hadoop分析?
浏览 1
提问于2015-07-30
得票数 1
回答已采纳
1
回答
使用Hadoop相关项目分析不断变化的使用模式
、
、
、
为了处理大量原始
数据
,我们正在学习Hadoop、
Hive
和相关项目。如果到目前为止我还在轨道上,
数据
通常是如何在这些场景中处理的:即。是否每隔一段时间对原始用户
数据
进行重新分析,以重新构建
索引
链接图? 我们是否在
数据
输入、分析和更新
数据
存储时进行
数据
浏览 3
提问于2012-08-08
得票数 0
回答已采纳
1
回答
如何在蜂巢内部建立
索引
?
、
、
索引
只不过是表的特定列上的指针。创建
索引
意味着在表的特定列上创建指针。如果在表中
索引
了某列,当查询该特定列时,如何指出该列的
数据
?
浏览 2
提问于2017-12-06
得票数 1
回答已采纳
3
回答
通过
Hive
将
数据
从HDFS
索引
到Elasticsearch
、
、
、
我正在使用Elasticsearch for Hadoop插件,以便通过
Hive
在Elasticsearch中读取和
索引
文档。我遵循了本页面中的文档:TBLPROPERTIES('es.resource' = '
hive
_test/names', 'es.index.au
浏览 3
提问于2015-07-16
得票数 0
2
回答
可以在启用了配置单元酸的orc表中执行upsert
我可以从
hive
表(基于ORC文件的表)中插入/更新/删除行,不知道是否可以执行upsert?因为当用户提供
数据
时,他们没有指定它是insert还是update,如果我们需要在插入之前对每一行执行delete来模拟upsert,它可能会非常慢,但还不能确定性能,所以我们的更新/插入比率很低,不到如果
hive
目前不支持upsert,有没有计划支持它?谢谢
浏览 5
提问于2016-12-16
得票数 0
1
回答
如何让雅典娜/普雷斯托识别拼花指数?
、
、
、
、
知道了这一点,我在本专栏上添加了一个
索引
,但没有显示
索引
该列在使用Athena (AWS服务)/ Presto (基础引擎)时实际上会影响性能。我正在尝试一个简单的选择,从哪里我要拉一个行,它是id-FROM widgets wid列是
索引
的,所以一旦Presto找到匹配项,就不应该再进行任何扫描我可以判断
索引
是否被正确使用,因为Athena返回操作中扫描的字节数。不管有没有
索引
,雅典娜将文件本身的字节大小作为扫描大小返回,这意味着它扫描了整个
浏览 0
提问于2018-09-24
得票数 2
回答已采纳
3
回答
从
Hive
到Solr Cloud的
数据
迁移
、
、
、
、
我在蜂窝和Solr云上工作,我必须
索引
从蜂窝到solr云的
数据
,我尝试了以下链接,但对我来说没有运气和执行第二个链接时出错我已经将
hive
-solr*.jar复制到所有主节点和从节点中的
HIVE
lib和HADOOP lib中。配置了tez的配置单元HADOOP
浏览 2
提问于2015-11-16
得票数 0
1
回答
配置单元3.x导致外部表中的压缩(bz2) json出错
、
、
、
我有一些JSON
数据
(大约60 in ),我必须加载到
Hive
外部表中。我使用的是
Hive
3.x和Hadoop 3.x。.JsonSerDe'我还加载了用于serde的jar,如下所示:一个DD JAR /usr/
hive
/lib/
hive
-hcatalog-core由于
数据
文件非常
大
,
浏览 33
提问于2021-02-16
得票数 0
1
回答
Hbase表导出到配置单元
、
、
Hello :)我正在准备将1HBase表的整个
数据
移动到
hive
。表的大小非常
大
(500TB) 作为搜索的结果,有hbase导出,但仅支持hbase和hbase之间的
数据
移动( hdfs中丢弃的文件不是纯文本,因此
hive
无法立即读取它们)此外,由于hbase是远程群集和各种安全策略如果能像
Hive
to
Hive
那样支持INSERT INTO语法就好了,但我正在寻找另一种方法。有没有用逗号分隔Hbase表的每一列并将其放到hdfs中的好方法?
浏览 14
提问于2020-08-27
得票数 1
2
回答
用浮动
数据
点计算
大
查询中的余数
、
Hive
查询语言有一个PMOD函数,可以用来计算余数。这个函数可以很好地处理整数和双。例如,当4.7除以2时,计算余数。选择PMOD(4.7,2);谷歌
大
查询有MOD功能来计算剩余部分。但是这个函数只适用于整数。在google
大
查询中使用浮动
数据
点计算剩余部分的任何帮助都将非常有用。
浏览 9
提问于2020-02-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hive之HiveQL索引
大数据入门基础系列之详谈Hive的索引
Hive数据模型
Hive的数据装载
走进大数据 数据仓库-Hive
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券