腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
按
最后
日期
进行
BigQuery
筛选
并
使用
分区
我问过如何过滤
最后
一个
日期
并得到很好的答案(
BigQuery
, how to use alias in where clause?),它们都有效,但是,它们扫描整个表,SETTLEMENTDATE字段是一个
分区
字段,有没有办法只扫描一个
分区
作为示例,我
使用
以下查询 #standardSQL FROM `biengine-252003.aemo2.daily` )
浏览 20
提问于2019-09-10
得票数 1
回答已采纳
1
回答
清除并回填每小时运行的DAG的特定实例?
我们有一个
按
小时运行的气流数据集,任务更新和覆盖
BigQuery
中的
日期
分区
表。在对这些表的查询和/或模式
进行
调整之后,我们想要回填几天的现有
分区
,但是回填所有运行都是巨大的浪费,因为每小时运行一次只会覆盖相同的
分区
24次,然后再转到第二天。我们可以
使用
airflow list_dag_runs列出所有运行
并
筛选
出每天的
最后
一个运行,但是是否有一种方法可以每天只回填/清除这些<e
浏览 3
提问于2020-06-10
得票数 0
回答已采纳
1
回答
为什么
BigQuery
BI引擎不
使用
所有预留?
、
、
我有一个连接到
BigQuery
表的仪表板,BI引擎按照我
使用
日历
筛选
器的预期工作,我的表是
按
日期
分区
的。当我选择一个较长的
日期
范围时,BI引擎停止工作,
并
显示以下消息:“该表或数据量已大于此时BI引擎支持的范围”,这是公平的。请注意,我已经在按
分区
进行
过滤,但有时,我需要查看整个数据 为了解决这个问题,我创建了一个BI预留,我注意到,无论大小为1,2,4 GB,
使用
的内存始终是600MB?
浏览 4
提问于2020-03-03
得票数 0
2
回答
如何从java创建
BigQuery
中的
分区
表?
、
我想从java在
BigQuery
中创建一个
分区
表(
按
字段划分,
按
日期
类型划分)。我找了很多,但这方面没有多少信息。build();
bigquery
.create(tableInfo); 我们是否应该
使用
TimePartitioning,即使我们想
按<
浏览 0
提问于2019-12-30
得票数 3
1
回答
我们能像在Hive中一样在大查询中创建动态
分区
吗?
、
、
我希望将存储在存储在桶中的所有数据(ex: /bucket/project/odate/odate_cust.txt)加载到大查询中的表中,哪个表是
分区
的?我需要逐个导入文件
并
加载,还是可以直接加载到多个
分区
。
浏览 2
提问于2017-10-03
得票数 0
回答已采纳
1
回答
BigQuery
:查询最新的
分区
、要处理的字节和实际处理的字节
、
、
我很难有效地查询表的
最后
一个
分区
,
使用
日期
或
日期
时间字段。更糟糕的是,
BigQuery
对
使用
活动查询处理的字节的估计与实际处理的字节不匹配,除非我没有正确地解释这些数字。在不匹配值的屏幕截图下面找到。
最后
,我还测试了几种场景: 如果我像建议的max_date那样首先
使用
语句存储一个DECLARE语句,那么这个估计似乎是可行的,但不清楚原因。但是,运行查询后的实际处理字节与
筛选
WHERE子句中最新
分区</e
浏览 0
提问于2020-07-15
得票数 0
1
回答
带
日期
范围控制器的过滤表
我正在
使用
来过滤报表的数据。我有以下简单的报告:我的默认
日期
范围是自动的:该字段配置为date如您所见,报告并不仅显示具有或介于某一
日期
之间的记录:在我的示例中,报告应该减少24thof January之前的
日期
。
浏览 5
提问于2022-01-28
得票数 0
回答已采纳
2
回答
创造性地
使用
日期
分区
我有一些数据,我想要按
日期
分区
,也要按内部定义的客户端id
分区
。这将允许我们每天加载数据,就像我们现在所做的那样,将提供
按</em
浏览 0
提问于2017-01-10
得票数 1
1
回答
在Scala的Spark
BigQuery
连接器中查询表时,如何过滤多个谓词?
、
、
、
、
目前,我在Spark中有一个想要查询的
BigQuery
表。该表在某个
日期
进行
分区
,为了查询该表,必须提供一个
筛选
器,以便BQ可以查询特定
分区
。我
使用
的是Spark
BigQuery
连接器:,并且
使用
的代码类似于这里提供的示例: 但是,这需要非常长的时间,因为表的大小是几in。由于表已经在date上
进行
了
分区
,所以我希望改为运行下面这样的命令 .option("filter"
浏览 16
提问于2021-09-20
得票数 0
1
回答
BigQuery
:
按
摄取时间与已
分区
日期
/时间戳划分的查询表的成本
我们正在尝试基于
BigQuery
在云中构建(或者更好地说是重建) DWH。我们决定
使用
“
按
日期
字段
进行
分区
”表(类似于“created_date”字段)来处理原始数据,而不是占用时间
分区
,因为有了这个特性,我们可以轻松地加载数据,然后
使用
"group“
分区
日期
列查询数据,构建我们假设这种
分区
方法将提高查询速度
并
降低查询成本(相对于非
分区
表--是的),但是
浏览 2
提问于2019-10-11
得票数 3
回答已采纳
2
回答
来自列的
BigQuery
日期
分区
、
我正在尝试理解如何从包含多天数据的csv文件加载数据
分区
表。我猜我正在寻找关系数据库在特定列上
进行
分区
时提供的类似功能,它负责将记录自动加载到正确的
分区
中。似乎
使用
bigquery
动态分配
分区
的唯一方法是
使用
分区
装饰器,这将要求我从CSV顺序加载每条记录(因为每行的
日期
可能不同),或者首先编写一个etl来
按
天将csv拆分到不同的文件。
浏览 10
提问于2017-03-05
得票数 0
回答已采纳
1
回答
如何
使用
dbplyr和
BigQuery
按
分区
进行
过滤
、
、
、
我
使用
dbplyr连接到
BigQuery
表,这些表是
按
日期
或时间
分区
的(列名为_PARTITIONDATE或_PARTITIONTIME)。在
BigQuery
中,您可以
使用
WHERE _PARTITIONDATE > "some date“
进行
过滤,以访问表的段并提高查询性能。但是当我通过dbplyr连接到一个表时,没有可以过滤的
分区
列。这是预期的行为吗?
浏览 31
提问于2021-06-23
得票数 0
3
回答
按月划分
BigQuery
表
time_partitioning_type=DAY是在
BigQuery
中对表
进行
分区
的唯一方法吗?除了
日期
以外,这个参数还能接受其他值吗?
浏览 7
提问于2017-01-11
得票数 3
回答已采纳
2
回答
Bigquery
Shard Vs
Bigquery
Partition
我有一个包含340 we数据的表,但我们只
使用
了过去一周的数据。因此,为了最大限度地降低成本,计划将这些数据移动到
分区
表或分片表中。全表-27秒
分区
表- 33秒切片表- 91秒谢谢,
浏览 0
提问于2016-09-15
得票数 6
1
回答
BigQuery
中与时区相关的问题(用于
分区
和查询)
、
、
使用
‘Exports’将要素日志导出到
BigQuery
使用
此日志表,我们需要每天生成报告。报告可以是每个活动每天的印象数。我们需要按ETC时间显示这些报告。因为
BigQuery
表是
按
UTC时区
分区
的,所以ET
浏览 0
提问于2019-03-11
得票数 4
1
回答
我可以一次替换
BigQuery
分区
表的
分区
间隔吗?
我正在
使用
Python处理
BigQuery
表,我希望实现一些看似可行但在文档中找不到的东西。job_config =
bigquery
.QueryJobConfig() job_config.destination = dataset.table("{}${}&
浏览 5
提问于2019-10-21
得票数 1
1
回答
如何
使用
BQ中的
分区
表?
我以前从未
使用
过
分区
表。我只是创建了一个示例,以确保我是否正确地理解了
分区
表。01-20 12 5 2017-01-20 该表由transaction_date列划分,有6个
分区
分区
2017-01-15和2017-01-20包含4行,而其他
分区
只包含一行。我说的对吗?
浏览 0
提问于2018-05-22
得票数 0
1
回答
可以在
BigQuery
中划分嵌套表吗?
、
、
我目前正在将数据仓库迁移到
BigQuery
中。我一直试图去美化数据库,因为我已经读到它可以带来更高效、更便宜的查询。然而,这导致了许多嵌套表。如果每个嵌套表都有一个列"created_at“和"last_modified_at",那么是否可以
使用
这些值中的任何一个来对表
进行
分区
?
浏览 3
提问于2021-12-02
得票数 1
回答已采纳
1
回答
BigQuery
表设计最佳实践:结合
日期
划分和分片?
、
、
、
简短问题:当由于4,000个
分区
限制而不能
使用
日期
字段
进行
分区
时,在
BigQuery
中分解/
分区
事实表的最佳方法是什么?目标是最大限度地提高查询性能和最小化成本。在Oracle中,我们只需
使用
整数
日期
YYYYMMDD
进行
分区
。但是,我不相信我们可以在
BigQuery
中做到这一点,因为一个表只能有4000个
分区
。假设表包含一个datetime列order_
浏览 3
提问于2020-03-24
得票数 0
1
回答
日志接收器到
bigquery
的
分区
不起作用
、
、
我在文件夹级别创建了一个日志接收器,因此它可以将所有日志整齐地流式传输到
Bigquery
。在日志接收器配置中,我指定了以下选项,以便让日志接收器流到(每日)
分区
: "bigqueryOptions": { "usesTimestampColumnPartitioning": true # output only } 根据
bigquery
documentation和
bigquery
resourc
浏览 19
提问于2020-04-28
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券