腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Hive
:
如何
连接
两个
表
,
使
来自
两
列
的
所有
条目
都在
最终
的
表
中
?
、
、
、
我在蜂巢里有
两
张桌子 t1:-------------A | 2B | 2 prod | revA | 1B | 1C | 1------------- A |
浏览 23
提问于2019-09-28
得票数 0
回答已采纳
2
回答
如何
在pyspark sql
的
大
表
中选择除2
列
以外
的
所有
列
?
、
、
、
、
在
连接
两个
表
时,我想从一个在databricks上
的
pyspark sql上有许多
列
的
大
表
中选择除其中
两
列
之外
的
所有
列
。我
的
pyspark sql: set
hive
.support.quoted.identifiers=none; select a.*, '?!
所有
列
都在</
浏览 5
提问于2020-07-28
得票数 0
1
回答
如何
搜索具有给定列名
的
所有
表
,并在Hadoop/
Hive
中
返回哪些
表
具有该列名?
、
、
我正在查找HDFS/
Hive
中
包含给定列名称
的
所有
表
。
浏览 1
提问于2015-02-02
得票数 1
2
回答
蜂箱
连接
查询优化
、
、
、
、
Table Acol1, col2,Adate,qty -------
表
的
大小如下:请考虑以下查询) A.col1, B.bdate; 上面的蜂巢查询在一个由4个从节点(8GB内存,100 GB磁盘)和1个主(16 GB内存,100 GB磁盘)组成
的
集群上需要超过
浏览 2
提问于2020-04-12
得票数 3
1
回答
PostGIS更新触发器
、
我有table_1有
列
point_id和几何学( point ),table_2有
列
: area_id、几何学(多边形)和一个table_3,其中包含table_1和area_id
表
2
中
的
所有
point_id
的
列表,如果是多边形内
的
点。每次将新多边形添加到table_2
中
时,我都会尝试更新point_id和area_id,因此对于从table_2到新多边形
的
table_1
中
的
每个点
浏览 6
提问于2022-03-16
得票数 0
回答已采纳
1
回答
如何
将
两个
表
组合在一起,
使
新
表
只具有第一个
表
中
的
新记录,而
所有
其他
表
都
来自
第二个
表
?
我
的
表
A有100万份记录,B
表
有1 000万份记录。
表
A可以有
表
B
中
没有的新记录。
如何
将这
两个
表
组合起来,
使
表
C拥有
来自
A
的
所有
记录和
来自
B
的
所有
记录,但与
来自
A
的
更新记录相比,
表
A和
表
B都有一个
列
ID,
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
1
回答
加入配置单元分区
的
存储桶
表
,在配置单元
中
仅包含存储区
表
(未分区
的
表
)
、
、
、
、
我有
两
张桌子:使用下面的条件创建另一个
表
select distinct
如何
减少时间,以及非分区/分桶
表
是否与分区/分桶
表
连接</
浏览 5
提问于2020-12-28
得票数 1
2
回答
将多
列
家族从hbase导入到
hive
、
、
、
我正在尝试将hbase
表
中
的
两个
列
族移到组
表
中
。我可以移动一个
列
的
家庭,但我
如何
能移动另一个在同一个蜂巢
表
。我在下面移动了一个
列
家庭。CREATE TABLE hbase_
hive
(key string, firstname string, age string) STORED BY ‘org.apache.hadoop.
hive
.hb
浏览 1
提问于2016-11-15
得票数 0
1
回答
使用zend db select join时选择表列
、
、
、
所以我使用Zend DB select和join()函数来
连接
两个
表
...在
连接
的
表
中有
两
列
具有相同
的
名称(假设它是
列
"id") (我想保留它) 但是,当我在对象上使用Zend_Paginator::factory()时,结果将只有一个
来自
两个
表
之一
的
"id“
条目
...我
如何
指定z
浏览 2
提问于2011-05-31
得票数 1
回答已采纳
2
回答
蜂窝
连接
在
两个
条件之间
、
、
我在
连接
两个
表
时遇到了问题,这是基于
Hive
中
的
“介于”条件。基本上,因为
Hive
不支持这些
连接
,所以我不知道
如何
解决它。基本上,我想
连接
两个
基于日期
列
的
表
,其中t1.date<=t2.date和t1.date>=t2.tdate2。
表
中
没有匹配
的
其他
列
。我怎样才
浏览 3
提问于2017-11-14
得票数 0
3
回答
没有键
连接
两个
相等
的
数据集
、
、
使用Hadoop,我想
连接
两个
记录数量相等但不带行号
的
文件。例如,A.txtb y和B.txt2 s加入后我需要b y 2 s这是完美的并排
连接
。我不知道
如何
在Hadoop
中
这样做,我相信我需要对
两个
文件进行初始传递才能追加行号? 利用猪
的
答案,和/或地图/减少技巧
的
各种组合都是很好
的
。
浏览 4
提问于2013-09-30
得票数 1
回答已采纳
1
回答
通过Sqoop将
所有
表
导入HBase
、
、
操作系统: Windowssqoop import-all-tables --hbase-table testhbaseall --hbase-create-tableusername root --pass
浏览 3
提问于2015-08-21
得票数 2
3
回答
我可以加入mysql
的
蜂巢吗?
、
、
我可以
连接
mysql和
hive
(hdfs上
的
蜂窝)之间
的
表
吗? 有人告诉我它在mysql和甲骨文之间起作用。
浏览 3
提问于2014-12-17
得票数 0
回答已采纳
1
回答
EXCEL / POWERQUERY/ VBA -合并具有多个实体
的
两个
表
、
、
、
、
我有
两个
文件,它们由
两个
来源生成。让我们分别调用9
列
和16
列
的
Source 1和2。合并/合并这
两个
文件,总共得到23
列
。请求者访问ID和管理员访问ID是
两个
来源
的
公共
列
。单个请求者可以在
两个
表
中都有多个
条目
。例如,1234500007出现
两
次,第一个请求仅用于查看(源1
中
的
列</
浏览 15
提问于2020-03-07
得票数 0
回答已采纳
1
回答
配置0.13外部
表
动态分区自定义模式
、
、
这就是我要做
的
我用.创造我
的
桌子。partitioned by (year int, month int, day int, hour int) 我
的
目录结构是
浏览 1
提问于2014-06-18
得票数 1
回答已采纳
1
回答
蜂巢排序合并桶联接
、
排序合并桶加入与排序合并桶映射
连接
不同吗?如果是的话,应该添加哪些提示来启用SMB
连接
?SMBM加入
如何
优于SMB
连接
?“设置
hive
.auto.convert.sortmerge.join=true”这个提示对SMB来说就足够了吗?否则,下面的提示也应该包括在内。集
hive
.optimize.bucketmapjoin =真集
hive
.optimize.bucketmapjoin.sortedmerge =真 我问
的
原因是,提示
中
写
浏览 5
提问于2016-11-04
得票数 4
1
回答
单元格:
如何
从多个文件或每个文件计数项创建多个
表
、
我
的
目标是将多个文件
中
的
条目
合并到一个
表
中
,但在实现时遇到了一些困难。#A18645student#X78543 但是,使用上面的代码,这会将
来自
N个文件
的
所有
数据合并到我
的
目录
中
,这使得合并数据变得很困难。我想要
的
是将
所有
文件
中
的
第一个
条目
连接
到一个字符串<e
浏览 1
提问于2018-05-01
得票数 0
2
回答
如何
使用DynamoDB (NoSQL)为学生/班级建模
、
、
、
什么是最好
的
(对吗?)考虑到我需要建立学生与班级之间
的
关系,对学生
表
和班级
表
进行建模
的
方法。我考虑到在DynamoDB
中
没有可用
的
第二索引。哪些学生属于某个特定
的
班级?
浏览 0
提问于2012-02-08
得票数 18
回答已采纳
2
回答
Apache不使用
来自
Hive
分区外部
表
的
分区信息
、
、
我有一个简单
的
Hive
外部
表
,它是在S3之上创建
的
(文件是CSV格式
的
)。当我运行
hive
查询时,它会显示
所有
记录和分区。但是,当我在Spark中使用相同
的
表
时( Spark在分区列上有一个where条件),它不会显示应用了分区筛选器。然而,对于
Hive
托管
表
,Spark可以使用分区信息并应用分区筛选器。是否有任何标志或设置可以帮助我使用星火中
的
Hive
外部<em
浏览 0
提问于2019-08-24
得票数 3
1
回答
映射到HBase
的
配置单元
表
上
的
联接
、
我们已经在HBase
中
创建了
表
,并使用HBase存储处理程序将这些
表
映射到配置单元。如果
表
有很大
的
记录,比如1亿条,如果我们需要基于某一
列
连接
两个
表
,如果这些
列
不是行键id
列
,性能会
如何
,有没有办法提高映射到HBase
的
Hive
表
的
表
连接
性能。 问候,GHK。
浏览 2
提问于2013-10-09
得票数 3
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券