腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
分区
的
ORC
数据
加载
到
bigquery
中
、
、
、
mrs-suds-sloaders/loader-log/output/{year}/{month}/{Day}/{Hour}/{Min}/ts_date={yyyy-mm-dd}/orid={orid}/file.
orc
mrs-suds-sloaders/loader-log/output/2020/08/06/00/30/ts_date=2020-08-05/orid=6691
浏览 0
提问于2020-08-11
得票数 4
1
回答
从
分区
的
ORC
加载
分区
的
BigQuery
表
、
、
我想通过
分区
ORC
列创建一个
BigQuery
分区
表
。GCS中
的
文件: mydate=2021-04-01/*.
orc
mydate=2021-04-30/*.
orc
命令bq: bq load --source_format=
ORC
--time_partitioning_fieldmydate --time_partitioning_type DAY mydataset.mytable gs:/
浏览 39
提问于2021-05-10
得票数 0
回答已采纳
1
回答
如何将
分区
数据重新
加载
到
ORC
中
、
、
有没有使用
分区
将数据
加载
到
ORC
中
的
最佳实践?如果我将120 GB
的
数据
加载
到
ORC
分区
表
中。Partition位于2列上。如果要重新
加载
特定
分区
的
数据,如何执行重新
加载
活动。如何删除
分区
,是Alter Table Drop partition(Partition值)。即使在删除
分区
后,我仍然在Hive/WareHou
浏览 0
提问于2015-05-07
得票数 0
1
回答
如何
从
按年份/月/日
分区
的
桶中
加载
数据到
bigquery
我们有一个数据存储在gcp桶中,格式如下- gs:/gcptest/Year=2020/Month=06/day=18/test1.parquet和day=18文件夹下
的
这么多文件。我希望在
bigquery
中创建一个
表
,其中
的
列存在于文件中,并按文件路径上
的
年份、月份和日期进行
分区
。这样,当我将数据
加载
到
表
中时,我可以
从
gcp桶中选择路径,并
加载
数据,这些数据将按路径
浏览 3
提问于2020-06-18
得票数 1
回答已采纳
1
回答
如何将已
分区
的
Hive
ORC
表
中
的
多个
ORC
文件(属于每个
分区
)组合为单个大
ORC
文件
、
、
、
我在蜂巢里有一个
分区
的
兽人
表
。在用HDFS上所有可能
的
分区
加载
表
之后--多个
ORC
文件,即HDFS上
的
每个
分区
目录都有一个
ORC
文件。我需要将每个
分区
下
的
所有这些
ORC
文件组合成一个大
的
ORC
文件,用于一些用例。 有人能建议我将这些多个
ORC
文件(属于每个
分区
)合并成一个大<
浏览 0
提问于2017-12-29
得票数 1
2
回答
提高
ORC
文件在蜂箱中
的
写入速度
、
、
、
目前,insert overwrite table T1 select * from T2;将在我
的
集群中花费大约100分钟。Table T1 is
ORC
格式化和T2 is text格式化。我正在从T2读取60 GB
的
文本数据,并将其插入
ORC
表
T1(插入后为10 GB )。如果我对两个
表
使用文本格式,插入大约需要50分钟。在这两种情况下,我们可以做些什么来提高写入速度(我有大量
的
表
要输入)或其他建议?
浏览 5
提问于2016-08-08
得票数 3
1
回答
如何将数据附加到
BigQuery
表
中
的
现有
分区
我们可以在
BigQuery
表
上创建一个
分区
,同时创建一个
BigQuery
表
。 如何将数据截断并
加载
到
BigQuer
浏览 8
提问于2017-11-08
得票数 1
1
回答
在Google中
加载
数据
的
最快方法应该是什么?
、
我想在谷歌云
bigQuery
中
加载
大容量
的
数据。蒂娅!
浏览 0
提问于2018-07-13
得票数 1
回答已采纳
2
回答
GZ到
ORC
文件
的
性能改进
、
请让我知道是否有更快
的
方式移动(*.gz)到兽人
表
直接。 1)另一个想法,
从
*.gz文件到非
分区
表
,而不是创建外部
表
和将gz文件数据转储到外部
表
。是否有其他方法可以更快地
从
Gz
加载
到外部
表
。(如果ADF在Azure Blob存储数据中心
的
集群上执行.exe,那么就不会有网络成本,没有网络延迟和上传未压缩数据
的
时间就会非常少)。那么ADF有可能吗?会不会是正确
的
做法
浏览 8
提问于2015-05-06
得票数 1
回答已采纳
1
回答
如何在
BigQuery
中提取年、月、日?
、
我已将csv文件保存在gcs上
的
路径中,如/data/yyyy=2020/yyyy=07/dd=03,/data/yyyy=2020/ mm =08/dd=04等。我一直在设法提取文件路径中
的
yyyy、mm、dd值,以便我可以使用它在
BigQuery
表
中填充类似的列。
浏览 3
提问于2020-10-11
得票数 1
回答已采纳
2
回答
将大容量数据
加载
到具有不同
分区
数据
的
BigQuery
分区
表
中。
我想要将CSV数据
加载
到包含不同
分区
BigQuery
的
table.My CSV文件中,我可以将整个CSV文件
加载
到
BigQuery
分区
表
中,以便将特定
的
csv
分区
数据分配到
BigQuery
中
的
各个
分区
。
浏览 5
提问于2017-04-17
得票数 0
回答已采纳
2
回答
将蜂巢查询推送到数据库级别
、
、
、
我有1亿条记录
的
表格数据,每条记录都有15列。我需要查询这些数据
的
3列,并筛选出用于进一步处理
的
记录。方法1将数据存储为中
的
csv或parquet。方法2使用HiveContext创建一个Hive
表
,并持久化该
表
和Hive元数据。需要时使用HiveContext查询此
表
。怀疑: 在方法2中,是否将查询推送到数据库级别(HDFS),并且只读取并返回满足条件
的
记录?或者将整个数据读入内存(与大多数火花作业一样),然后使用元数
浏览 0
提问于2018-04-10
得票数 3
1
回答
从
单元格管理
的
分区
表
中插入
ORC
分区
表
任何人,都知道如何
从
带有
分区
的
Hive托管
表
中查询
ORC
分区
表
插入。我没有这样做。即使在为HIVE
表
插入新
分区
之后,我也无法使用SELECT和WHERE…查询它。好了!以下是我
的
查询详细信息:>CREATE TABLE mydb.loan_
orc
(<NON PARTITION COLUM
浏览 3
提问于2015-06-26
得票数 0
2
回答
如何提高蜂箱中
从
非
分区
表
加载
数据到
ORC
分区
表
的
性能
、
、
、
我对Hive查询很陌生,我正在寻找
从
Hive
表
中检索数据
的
最佳实践。我们已经启用了TeZ具有执行引擎和启用了矢量化。 我们希望
从
Hive
表
中进行报告,我
从
TEZ文档中看到,它可以用于实时报告。2)我们发现
的
另一个问题是,最初我们在HDFS中有指向Blob/File
的
未
分区
表
,它
的
大小为60 GB,有200列,当我们将数据
从
非
分区
表
转储到
浏览 2
提问于2015-03-07
得票数 1
回答已采纳
1
回答
BigQuery
:将日期
分区
表
更改为摄取时间
分区
表
我有一个
BigQuery
日期
分区
表
,我想将该
表
转换为摄取时间
分区
表
(在_PARTITIONTIME上进行
分区
),使用当前
的
日期
分区
将其输入_PARTITIONTIME。我该怎么做? 为什么?,因为只有摄入
分区
表
才能增量
加载
到使用
BigQuery
的
预定查询功能(通过使用@rundate参数作为
分区
装饰器)
浏览 3
提问于2018-10-17
得票数 2
1
回答
用Java在BiqQuery中创建数据
加载
表
、
根据这里
的
文档:,
BigQuery
应该可以根据数据创建
表
。 但是,每当我尝试
从
浏览 1
提问于2018-09-25
得票数 0
2
回答
星火壳按
分区
加载
现有的蜂窝
表
?
、
、
、
在spark-shell中,如何
加载
现有的Hive
表
,但只
加载
其中
的
一个
分区
?val df = spark.read.format("
orc
").load("mytable")谢谢!
浏览 19
提问于2020-04-30
得票数 0
回答已采纳
1
回答
有办法在
BigQuery
表
上创建自定义
的
日
分区
吗?
、
、
我是
BigQuery
的
新手,我正在尝试创建带有日
分区
的
表
,而不是google允许
的
默认
分区
。是否有可能备份日期日期
的
日
分区
?由于我试图
加载
历史数据,所以今天使用这些
分区
是没有帮助
的
。我正在通过Google在
BigQuery
中创建
表
。 谢谢!
浏览 0
提问于2017-10-06
得票数 0
回答已采纳
1
回答
BigQuery
最大
分区
在2000年超过2500个
分区
根据,
分区
表
可以有2500个
分区
: $ bq query --destination_table grey-sort-challenge:partitioning_magic.nyc_taxi_trips_partitioneduse_legacy_sql=false "select * from \`grey-sort-challenge.partitioning_magic.nyc_taxi_trips
浏览 0
提问于2018-03-28
得票数 3
回答已采纳
1
回答
将数据
从
云存储
加载
到
表
中
的
特定
分区
是否有任何方法直接将数据
从
云存储
加载
到
表
中
的
特定
分区
?我知道,
Bigquery
在预定
的
查询中有WRITE_TRUNCATE,但是如何将它与云存储结合起来呢?或者,这是将大量数据(5000万条记录)释放到
Bigquery
表
中特定
分区
的
其他方式吗?
浏览 3
提问于2022-09-23
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券