腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
两个
不同
的
表
数
插入
到
Hive
表
中
、
、
、
我需要将来自
两个
不同
表
计数
的
数据
插入
到
配置单元
表
中
。现在我有另外
两个
表
test1和test2。我需要
插入
到
sample.counter1 as select count(*) from test1和sample.counter2 as select count(*)
浏览 14
提问于2019-07-07
得票数 1
回答已采纳
1
回答
如何在Spark中将每个列重新分区为固定数量
的
分区?
、
、
我需要从一个
hive
表
中
读取数据并将其
插入
到
另一个
Hive
表
中
。这
两个
表
的
模式是相同
的
。该
表
按日期和国家进行分区。每个分区
的
大小约为500MB。我想将这些数据
插入
到
一个新
的
表
中
,其中每个分区
中
的
文件大约为128MB(即4个
浏览 42
提问于2021-11-09
得票数 0
1
回答
如何在
Hive
中将未分区
表
的
列
插入
到
已分区
表
中
?
有一个
表
‘A’已分区。另一个
表
'B‘未分区。如何将B
的
值
插入
到
A
中
?会抛出错误吗?
浏览 1
提问于2015-06-05
得票数 0
1
回答
火花-蜂巢分区
、
Hive
表
是使用4个分区创建
的
。cells int, sms_in int) partitioned by (traffic_date_hour string) stored as ORC into 4 buckets 问题是,当
插入
发生在
hive
表
中
时,它有128个分区,而不是4个桶
浏览 2
提问于2016-03-21
得票数 1
1
回答
蜂箱汤匙和水桶
、
、
我现在正在学习桶,我
的
任务是创建一个由2个桶组成
的
Hive
表
,然后将至少5条记录放入该
表
中
。CREATE TABLE <tablename>(id INT,field2 STRING,field3 TINYINT) CLUSTERED BY(id) INTO 2 BUCKETS;SELECT * FROM <tablen
浏览 4
提问于2020-04-13
得票数 1
回答已采纳
1
回答
我是否可以像在SQL中一样将数据
插入
到
Hive
中
的
表
中
?
、
、
我目前正在学习如何使用
HIVE
,现在我正在尝试创建
表
并将值
插入
其中。似乎
HIVE
只支持使用其他
表
中
的
"select“数据或将数据加载到
表
中
,从而将数据
插入
到
表
中
。我是否可以将行
插入
或追加到单元格
中
,与SQL
中
类似?例如:
插入
测试值(1,1,1);似乎不可能,因为我尝试了许多组合,并总
浏览 1
提问于2014-07-16
得票数 2
回答已采纳
1
回答
如何使用
Hive
使用单个hdfs路径创建n个外部
表
、
、
、
、
是否可以使用配置单元创建指向单个hdfs路径
的
n个外部
表
。如果是,那么它
的
优点和局限性是什么?
浏览 161
提问于2019-01-04
得票数 3
2
回答
为什么蜂箱
中
的
桶
数
应该等于减速机
的
数量?
、
、
、
、
在蜂箱
中
,为什么桶
的
数量应该等于减速器
的
数量?
浏览 7
提问于2017-08-03
得票数 0
回答已采纳
1
回答
通过一些数据转换,哪个组件更适合将数据从HDFS移动到
Hive
?
、
、
、
我需要将一些数据从HDFS加载到
Hive
。但我需要在HDFS
中
的
文件之间进行一些聚合。我读到Sqoop可以做到这一点,但只能使用MySQL。要这样做,我还有其他选择吗? 谢谢!
浏览 4
提问于2016-06-10
得票数 0
1
回答
在HBase
中
对现有
表
进行配置单元查询
、
我已经使用CREATE EXTERNAL table命令为HBase
中
的
现有
表
在
HIVE
中
创建了
表
。但是当通过配置单元查询
表
时,返回'0‘条记录。通过日志确定
HIVE
正在HADOOP
中
而不是在HBase
中
执行MAP-REDUCE程序 在配置配置单元和HBase时,我是否遗漏了什么?
浏览 0
提问于2012-04-07
得票数 1
1
回答
Hadoop 3
中
的
星火和蜂巢: metastore.catalog.default和spark.sql.catalogImplementation
的
区别
、
、
、
、
由于星火目录和
Hive
目录是分开
的
,所以知道如何在Spark应用程序中保存数据,以及在何处保存数据,有时会有些混乱。我知道,属性spark.sql.catalogImplementation可以设置为in-memory (使用基于session
的
目录)或
hive
(使用
Hive
目录来存储->
的
持久元数据,但元数据仍然与
Hive
和
表
分离)。当我将它设置为
hive
时,我可以看到我
的
Hive
浏览 4
提问于2020-01-24
得票数 9
回答已采纳
1
回答
从spark
插入
到
群集配置单元
表
、
、
这个想法是使用配置单元
的
分组法/集群来存储可用
的
设备(基于列id)。我目前
的
方法是根据拼接文件将外部
表
中
的
数据
插入
到
表
中
。因此,它应用了分组法。month, day)FROM parquet_table ; 我想通过直接从PySpark 2.1将数据摄取到该
表
中
来摆脱这一步骤使用Sp
浏览 0
提问于2018-02-27
得票数 2
1
回答
从HDInsight
中
的
Azure
表
存储读取数据
、
、
我想使用Azure Table Storage作为我在HDInsight上运行
的
Hadoop应用程序
的
数据源。我只找到了微软
的
,但是没有足够
的
文档。我有几个关于从Azure Table采购
的
问题: 1)数据块是如何形成
的
?假设,我可以将一个分区
中
的
记录分配给每个映射器吗?如果是,如果分区包含许多记录,会发生什么情况?如果不是,它是如何工作
的
?3) Hadoop作业可以从
两个
(或更多) Azure
表
<
浏览 0
提问于2015-12-11
得票数 0
1
回答
使用Apache导入或索引
Hive
/HDFS数据
、
、
我希望使用导入或索引存储在HDFS上Parquet文件
中
的
Hive
表
。据我所知,第一步是将数据导入或索引到solr
中
,但我对此知之甚少。 请帮帮忙。
浏览 0
提问于2018-05-02
得票数 2
1
回答
如何将多个Json文件(可能具有
不同
的
字段)加载到一个配置单元
表
中
、
、
我有
两个
JSON文件,它们是在
两个
不同
的
日期生成
的
。它们都属于相同
的
业务规范。所以我想
插入
到
一个
hive
表
中
。如何做到这一点?场景:第二个JSON:{ "a":1,"b",2,"c",3 } 以上两项都必须
插入
到
同一
浏览 0
提问于2019-03-03
得票数 1
2
回答
HBase和HCatalog之间
的
相关性是什么?
、
、
请解释一下,HCatalog和HBase之间
的
关系是什么?Apache HCatalog HCatalog是一个元数据抽象层,用于引用数据,而不使用底层文件名或格式。它将用户和脚本与物理存储数据
的
方式和地点隔离开来。我们在
Hive
中使用creates,它在HCatalog
浏览 4
提问于2013-11-15
得票数 7
回答已采纳
2
回答
蜂箱和分区
、
、
我们应该根据什么来缩小范围,无论是使用分区还是在蜂巢
中
的
一组列上使用桶?假设我们有一个庞大
的
数据集,其中有
两个
列是最常被查询
的
--所以我很明显
的
选择是基于这两列创建分区,但如果这会导致在大量目录
中
创建大量
的
小文件,那么基于这些列对数据进行分区是一个错误
的
决定,并且可能是一个更好
的
选择我们是否可以定义一种方法,我们可以用它来决定我们应该采用
的
是桶式还是分区?
浏览 3
提问于2015-12-04
得票数 0
回答已采纳
16
回答
类似SQL
的
配置单元
插入
查询
、
、
、
我是
hive
的
新手,想知道是否有像我们在SQL
中
那样
插入
数据
到
Hive
表
中
的
方法。我想将我
的
数据
插入
到
配置单元
中
,如下所示 INSERT INTO tablename VALUES (value1,value2..)我读到您可以将数据从文件加载到
hive
表
,或者您可以将数据从一个
表
导入
到
<em
浏览 3
提问于2013-07-02
得票数 65
回答已采纳
2
回答
错误无法识别的参数--
hive
-partition key
、
、
、
当我运行以下语句时,我得到了错误Unrecognized argument --
hive
-partition-key:--connect 'jdbc:sqlserver:/192.168.56.1;database=xyz_dms_cust_100;username-hadoop;password=hadoop' --
hive
_import--delete-target-dir --
hive
-table purchase
浏览 2
提问于2015-07-27
得票数 2
1
回答
通过将分区目录复制
到
仓库
中
来复制
Hive
托管
表
、
、
、
、
我有一个现有的桶形
表
,它有YEAR, MONTH, DAY分区,但是我想通过INGESTION_KEY添加额外
的
分区,这是现有
表
中
不存在
的
列。这是为了适应未来
的
表
插入
,这样我就不必每次获取数据时都需要OVERWRITE一个YEAR, MONTH, DAY分区;我只需做一个简单
的
INSERT INTO并创建一个新
的
INGESTION_KEY分区我需要新
表
中一年
的
数据才能开始,所以我想
浏览 2
提问于2017-02-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Access表中设置不同颜色显示数字的正负值和零
使用影刀RPA在不同表中替换符合要求的内容
Sqoop使用实例讲解
如何实现同时从Excel的多个工作表中模糊和精确查询指定的数
0458-Hive数据类型校验问题分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券