腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Hive
Bucket
上
的
Max
函数
、
我在
HIVE
中有一个表结构,如下所示-(RoleCapability STRING,FIELDS TERMINATED BY ','TBLPROPERTIES('created on' = '12 Aug'); 现在,我想从表中
的
每个存储桶中查询
MAX
(MAR
浏览 12
提问于2018-08-25
得票数 1
1
回答
配置单元0.13分桶
的
映射联接
、
、
、
历史上有没有人在
Hive
13中成功地执行了一个分桶
的
map join?关于BMJ (和)
的
文档有限。它们看起来很棒,但我不能让它们工作。如果我理解正确,我必须使用以下参数启动我
的
命令:这将导致
Hive
自动将我
的
懒惰
的
、超级慢
的
、常规
的
旧
的
缩减连接转换为轻便(svelte、快速完成
的
、分桶
的</e
浏览 0
提问于2015-05-20
得票数 3
2
回答
如何使用load DATA LOCAL INPATH加载存储桶配置单元表
我们可以使用LOAD DATA LOCAL INPATH ...命令加载一个分桶
的
配置单元表吗?我已经为一个示例文件执行了它,但是数据值被插入为NULL。/
hive
_external' overwrite into table emp_
bucket
;Table default.emp_
bucket
)> select * from emp_
bucket
;emp_
bu
浏览 13
提问于2016-03-14
得票数 1
1
回答
在trino中读取单元桶表时,是什么原因导致表损坏?
、
首先,不能公开数据
的
格式,但桶表是通过以下表格创建语句和
hive
中
的
选项创建
的
。'...set
hive
.enforce.bucketing = true;set
hive
.exec.
max
.dynamic.partitions=1000; set
hive
.exec.
max
.dynamic.p
浏览 2
提问于2021-11-29
得票数 1
回答已采纳
1
回答
如何在google dataproc
上
执行单元作业时使用params/properties标志值
我试图使用以下gcloud命令在google中执行一个
hive
作业:gcloud dataproc作业提交单元--集群=msm-测试-集群--文件
hive
.sql -params=
bucket
1 1=abcdset x=${
bucket
1}; s
浏览 5
提问于2017-07-07
得票数 0
回答已采纳
1
回答
加入配置单元分区
的
存储桶表,在配置单元中仅包含存储区表(未分区
的
表)
、
、
、
、
我有两张桌子:57 output format: org.apache.hadoop.
hive
.ql.io.HiveSequenceFileOutputFormat58 serde: org.apache.hadoop.
hive</e
浏览 5
提问于2020-12-28
得票数 1
2
回答
“EMR服务角色在创建EMR群集时无效”
、
、
在创建了Amazon,my_
bucket
之后,我通过cli创建了一个弹性地图减少集群: 创建-集群-名为"
Hive
测试“--ami-version 3.3 --应用程序Name=
Hive
--使用默认角色--实例类型m3.xlarge -实例-count 3-steps Type=
Hive
,Name="
Hive
Program",Args=-d,emr =s3://my_
bucket
/input,d.OUTPUT=S3:
浏览 0
提问于2015-01-14
得票数 11
回答已采纳
3
回答
为什么星火saveAsTable与bucketBy一起创建数千个文件?
、
星星之火-提交在集群模式.我正在从hdfs读取一个拼花文件: .appName("myApp") .bucketBy(50, "userid")现在,当我查看hdfs /user/
hive
/warehouse
上
浏览 0
提问于2018-02-02
得票数 24
回答已采纳
2
回答
带emrfs
的
配置单元
、
、
我正在使用sqoop将表从Amazon RDS导入到
Hive
。该进程正在运行,数据存储在配置单元
的
默认hdfs目录中: /user/
hive
/warehouse。我
的
理解是,我需要(在主节点
上
的
hive
-site.xml中)将属性
hive
.metastore.warehouse.dir
的
值更改为s3//
bucket
/warehouse-location。
浏览 12
提问于2017-02-11
得票数 0
2
回答
找不到类'org.apache.hadoop.
hive
.druid.DruidStorageHandler‘
、
、
、
、
druid
hive
处理程序
的
jar文件就在那里。Clients表已在包含数据
的
配置单元中。配置单元库文件夹
hive
-druid-handler-3.1.2.jar中
的
文件名。当我尝试为德鲁伊在
hive
中创建表时,我得到了错误an FAILED: SemanticException Cannot find class 'org.apache.hadoop.
hive
.druid.DruidStorageHandlerCREATE TABLE ssb_druid_
浏览 5
提问于2019-12-17
得票数 3
1
回答
蜂箱桶-理解TABLESAMPLE(Y中
的
X桶)
、
、
嗨,我是非常新
的
蜂巢,我已经通过了桶
的
概念在hadoop
的
行动,但未能理解下面的lines.can,有人帮助我这一点吗?SELECT avg(viewTime)TABLESAMPLE
的
一般语法是TABLESAMPLE(桶x出y) 查询
的
样本大小约为1/y,此外,y需要是表创建时为表指定
的
桶数
的
倍数或因子。例如,如果我们将y更改为16,查询将变为
浏览 3
提问于2013-09-13
得票数 9
1
回答
运行单元脚本
的
AWS,EmrActivity步骤在“没有这样
的
文件或目录”时立即失败
、
、
、
、
我有一个简单
的
DataPipeline作业,它只有一个EmrActivity,其中一个步骤试图从我
的
s3桶中执行一个
hive
脚本。--run-
hive
-script --args -f s3://[
bucket
-name-removed]/s1-tracer-hql.q -d INPUT=s3://[
bucket
-name-removed] -d OUTPUT=s3://[
bucket
-name-re
浏览 3
提问于2015-11-14
得票数 1
回答已采纳
3
回答
如何使用Terraform在AWS EMR中传递多个引导程序操作?
、
service_role = "${var.service_role}"我传递了包括bootstrap在内
的
所有变量: bootstrap_actions = [ "path=s3://
bucket
/bootstrap/
hive
/metastore/JSON41.sh,name=SERDE","path=s3:&
浏览 2
提问于2017-05-27
得票数 2
2
回答
如何使用DataprocHiveOperator从
Hive
作业输出日志中提取查询结果?
、
、
、
、
我试图使用气流构建数据迁移管道,源是Dataproc集群
上
的
Hive
表,目标是BigQuery。我使用DataprocHiveOperator从源获取模式和数据。这个操作符在内部使用Dataproc REST来提交和执行我们指定
的
Dataproc集群
上
的
作业。输出将作为作业日志
的
一部分写入到文件中。我只需要这些日志
的
查询结果。, output_
bucket
,output_path): client = storage.
浏览 0
提问于2019-09-03
得票数 3
回答已采纳
1
回答
如何根据列中
的
值范围拆分数据帧并将其存储在单独
的
文件中?
、
、
----------|----|--------||-----------|----|--------|| SAP | 20 |
Hive
|| Oracle | 21 |
Hive
||-----------|----|--------| dataframe包含类型为
浏览 19
提问于2019-09-16
得票数 0
回答已采纳
1
回答
如何使用臭氧创建蜂巢表?
、
如何使用臭氧对象存储创建
hive
表。
浏览 5
提问于2021-08-26
得票数 0
4
回答
避免使用hadoop在_$folder$中创建S3密钥(EMR)
、
、
、
我正在使用AWS数据管道中
的
EMR活动。此EMR活动正在EMR群集中运行一个单元脚本。它以dynamo作为输入,并将数据存储在S3中。 这是EMR活动中使用
的
EMR步骤。s3://elasticmapreduce/libs/script-runner/script-runner.jar,s3://elasticmapreduce/libs/
hive
/
hive
-script,--run-
hive
-script
浏览 4
提问于2017-03-18
得票数 12
回答已采纳
2
回答
如何在机器内部运行?
、
、
、
有几件基本
的
事情对我不起作用: - querying the table raises在这方面找不到任何好
的
文件--有人对此有什么想法吗?
浏览 5
提问于2015-10-19
得票数 1
回答已采纳
2
回答
根据S3目录名自动划分配置单元表
、
/
bucket
/date=20140701/fileN /
bucket
/date=20140702/file2...然而,
Hive</
浏览 1
提问于2014-08-05
得票数 5
1
回答
max
_
bucket
_count
函数
的
意外行为
、
根据cplusplus.com,unordered_set::
max
_
bucket
_count()
函数
应该返回容器在运行程序
的
系统
上
可以拥有的最大桶数 us.insert(word); co
浏览 2
提问于2016-03-03
得票数 1
回答已采纳
点击加载更多
相关
资讯
来学习几个简单的Hive函数啦
Python:max和min函数的高级使用
大数据入门基础系列之浅谈Hive的桶表
Excel–min max 函数的另类用法,按规则计算奖金提成
切片上的健壮范型函数
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券