腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用存储处理程序和配置单元
更新
JDBC
数据
库表
、
、
、
、
我读到过使用
Hive
JDBC存储处理程序(),
Hive
中的外部表可以在不同的
数据
库(MySQL、Oracle、DB2)上创建,并且用户可以使用
Hive
使用此处理程序对JDBC
数据
库进行读写。我的问题在
更新
中。如果我们使用
hive
.14,其中支持配置单元
更新
/删除,并使用存储处理程序将外部表指向JDBC
数据
库表,那么当我们从配置单元端启动
更新
查询时,它是否允许我们也
更新
数据</em
浏览 6
提问于2017-07-14
得票数 0
1
回答
蜂巢3上的蜂巢兽人酸是否需要TEZ (如果不使用)?
、
、
、
、
我的理解是,对于
Hive
3,使用MERGE的
HIVE
表也至少需要TEZ作为底层执行引擎,如果没有使用Map,或者使用
Hive
的Spark。事实上,我不相信蜂巢合并,
更新
,删除工作与火花引擎。而且,来自的斜体和粗体语句声明了完全事务功能,但我无法遵循,因为我不知道SPARK可以
更新
、删除
HIVE
(尚未):Apache使用
Hive
连接器获得可
更新
的表和ACID事务。
Hive
连接器还支持流DataFrames,用于
浏览 3
提问于2019-12-04
得票数 0
回答已采纳
6
回答
如何识别用户在蜂窝CLI中使用的
数据
库?
在使用命令行接口时,是否有任何方法可以识别用户使用的是哪个
数据
库?
浏览 10
提问于2013-08-01
得票数 18
回答已采纳
2
回答
单元:是否有禁用分区统计信息的方法?
问题摘要:我有几个查询,它们从一个单元表中选择
数据
并将其插入到另一个表中,该表被动态地划分为大约8000个分区。查询迅速而正确地完成。输出文件很快被复制到分区目录中。:updatePartitionStatsFast(292)) - Updated size to 1042 每个这样的分区
更新
大约需要500毫秒。但是,在进行这些
更新
时,
Hive
在整个表上设置了一个独占锁,而对
浏览 6
提问于2014-07-17
得票数 0
回答已采纳
1
回答
蜂箱
更新
效率(0.14版)
、
如何有效地处理未分区的列上的
更新
? 假设我想
更新
特定事务it (未分区)的行,
Hive
将如何在内部处理它。据我所知,
Hive
将首先搜索这个分区(这很慢),然后
更新
这个特定的分区(如果有的话),其中存储了这个包含这个事务处理符的特定行。尽管这将为用户提供一个
更新
数据
的抽象,但是执行大量
更新
真的有效吗?
浏览 4
提问于2015-04-23
得票数 1
1
回答
跨Spark会话保存未物化的
数据
文件
、
、
、
我正在使用Spark来分析存储在Cassandra集群上的
数据
。在一个会话中,这可以很好地工作,但是将来我希望能够使用他们的连接到Tableau。由于我们对宽行/动态列的依赖,
数据
不是以适合直接用作分析表的格式存储在Cassandra中的,因此我有一系列Spark SQL操作,将选定的
数据
枢轴到一个更可用的结构中。我希望能够在spark会话中存储这个旋转表的定义,这样它就可以被新的spark应用程序捕获,而不需要额外的设置,理想的情况下也可以在Tableau中使用--有很多关于使用
Hive
保存跨会话的物化RDDs
浏览 1
提问于2019-07-29
得票数 0
1
回答
hdfs和
hive
有什么关系?
、
我有psudeo分布式hadoop环境,并使用sqoop和
hive
进行
数据
导入和分析。我使用sqoop将
数据
从mysql导入到蜂箱中,它起作用了,我在我的蜂巢位置(也就是/user/
hive
/warehouse/ )获得了
数据
,我可以在
hive
表中看到
数据
。我的怀疑是: 为什么它要在我的hdfs
浏览 5
提问于2017-01-11
得票数 0
1
回答
Avro表上的count(*)返回0
、
我最近在
Hive
中将AvroSerDe用于我的外部表。from table上面的查询给出了一个计数。
浏览 0
提问于2019-05-11
得票数 1
2
回答
Spark连接
Hive
到HDFS vs Spark直接连接HDFS,
Hive
在上面吗?
、
、
、
、
问题摘要:当然,我希望使用配置单元上下文将
数据
馈送到HDFS。定义了模式,并按批或按行馈送
数据
。 还有另一种选择。我们可以直接将
数据
写入HDFS,这要归功于spark streaming API。我们也在考虑这一点,因为我们可以在这个用例中通过<e
浏览 0
提问于2019-06-19
得票数 1
1
回答
尝试使用不支持这些操作的事务管理器进行
更新
或删除。
、
、
在中试图
更新
Hive
表中的
数据
时,我会得到这个错误。
hive
.enforce.bucketin
浏览 2
提问于2015-12-10
得票数 17
4
回答
蜂箱
更新
和删除
、
、
我使用的是
Hive
1.0.0版本和Hadoop2.6.0以及Cloudera驱动程序。我正在尝试从Cloudera HiveOdbc驱动程序中
更新
和删除
hive
数据
库中的
数据
,它会引发一个错误。插入:通过传递上述查询,
数据
将插入到
数据
库中。
浏览 8
提问于2015-05-31
得票数 1
2
回答
使用Sqoop将
数据
附加到单元表中
、
我正在尝试将
数据
附加到
hive
.Using中已经存在的表中,下面的命令如下:首先,我将表从导入到
hive
。现在,我希望将
数据
附加到"Batch_Id < 100“所在的同一现有表中,我使用的命令如下: sqoop import --connect "jdbc:sqlserver://XXX.XX.XX.XX-table "my_table" --where "Batch_Id < 100" --username myuser
浏览 2
提问于2014-01-08
得票数 2
1
回答
无法
更新
Hive
事务表
、
我正在尝试
更新
Hive
事务表,但它给出了以下错误: set
hive
.support.concurrency = true;set
hive
.txn.manager= org.apache.hadoop.
hive
.ql.lockmgr.
浏览 10
提问于2017-07-19
得票数 1
6
回答
RDBMS和
Hive
有什么区别?
、
、
、
在像MySQL这样的远程
数据
库管理系统中,
Hive
上也有
数据
库吗?我在手册上看到,
hive
只有表,我对此有点困惑。Tks之前
浏览 0
提问于2011-08-03
得票数 8
2
回答
使用sqoop在配置单元表中进行索引
更新
、
、
Memberid - bigint插入日期-日期我想使用sqoop将这些
数据
导入
HIVE
表中。=STRING,INSERTDATE=TIMESTAMP,UPDATEDATE=TIMESTAMP --
hive
-table memberimport -m 1 它工作正常,能够导入
HIVE
表中的
数据
现在,我想用updatedate (今天的最后一个值)的增量
更新
来
更新
这个表,这样我就可以使用sqoop将该OLTP
浏览 1
提问于2016-07-05
得票数 1
2
回答
蜂窝仓库路径使用-默认路径,而不是我自己的hdfs路径
、
Probelm:
数据
库是在默认的仓库目录中创建的,而不是应用程序特定的目录:/ app /myApp/
HIVE
/仓库SET
hive
.exec.scratchdir=/app/myApp/
HIVE
/TMP;[hiveuser@cdh1/
hive
-
浏览 1
提问于2015-10-09
得票数 0
2
回答
仅列出默认DB。
、
、
、
、
当我试图通过星火列出所有的蜂巢
数据
库时(1.6)tdf: org.apache.spark.sql.DataFrame= [result: string]+-------++-------++-------+OK def
浏览 1
提问于2018-07-02
得票数 3
回答已采纳
3
回答
从Spark添加的
数据
上的ACID事务不工作
、
、
我正尝试在
Hive
中使用ACID事务,但在使用Spark添加
数据
时遇到了问题。string)STORED AS ORC TBLPROPERTIES('transactional'='true');at org.apache.hado
浏览 0
提问于2016-09-15
得票数 3
2
回答
配置单元中的增量
更新
、
、
、
出于分析目的,我必须将
数据
导出到
Hive
。最初,当MySQL中的
数据
较小时,使用Sqoop将Mysql
数据
完全导出到
Hive
不是问题。现在,随着我的
数据
大小的增长,我如何将MySql
数据
增量
更新
到
hive
?
浏览 0
提问于2016-05-03
得票数 0
1
回答
仅当值不同时才
更新
HBase表
、
、
我正在通过HBase通过Pig加载
数据
。pig脚本每天运行以查找各种蜂巢表中的
更新
记录,执行联接和处理,然后加载到HBase。我遇到的问题是,有时记录的一部分会被
更新
,而其他部分则不会
更新
。示例:带有键abcd123的记录存在于
hive
表1和
hive
表2中。在
hive
表1中,有新的
数据
,但在
hive
表2中没有。我的猪脚本将两个表连接起来,然后将连接的记录加载到hbase中,
更新
hbase中的现有记录以获取密钥abcd
浏览 2
提问于2016-10-25
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
hive拉链表优化·百亿量级数据支持准实时更新
Hive数据模型
Hive的数据装载
走进大数据 数据仓库-Hive
HIVE小结 HIVE基本语法,大数据基础知识理解
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券