腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
DBT
构建增量表时修剪
BigQuery
分区
、
、
我又有一个与这个问题相同
的
问题: 如
何在
不
每次
扫描
整个
表
的
情况下
使用
DBT
中
的
BigQuery
创建增量表?建议
的
增量表格式不起作用(它
扫描
整个
表
),也不支持声明(我认为?)。详细信息{% if is_increm
浏览 12
提问于2022-07-27
得票数 0
回答已采纳
2
回答
如
何在
不
扫描
整个
表
的
情况下
选择
DBT
中
bigquery
表
的
最新
分区
?
、
、
我尝试从
BigQuery
表
中
选择
最新
的
分区
,而不是
扫描
DBT
模型
中
的
整个
表
,以节省查询成本。
DBT
不允许在数据模型中使用分号,因此使用DECLARE+SET脚本语句不能像建议
的
那样工作。
DBT
有一个sql_header宏,它允许在头文件
中
设置一些变量,但是这个头文件不接受对数据模型
的
引用,或
浏览 6
提问于2021-02-19
得票数 4
回答已采纳
1
回答
使用ARRAY_AGG + OffSet视图,而不使用对象
表
上
的
日期
分区
的
好处
、
、
我有一个日期(createDt)
分区
表
,被卡夫卡流数据加载。我只想
选择
基于updatedTime按ID列分组
的
最新
记录。我能够实现它通过第二个顶级解决方案提到
的
。createDt查询createDt,则会
扫描
整个
基
表
,这是我
不
希望发生
的
。但是,如果我创建一个正常
的
视图,
如
浏览 10
提问于2022-09-16
得票数 0
回答已采纳
1
回答
为什么
BigQuery
扫描
整个
表
,尽管它是按小时
分区
的
?
该
表
按小时进行
分区
:但是,无论我在block_timestamp上指定什么过滤器,
BigQuery
都会
扫描
整个
表
。您可以查看该
表
的
大小和在查询
中
扫描
的
数据量,以确保。
BigQuery
不是应该只
扫描
被过滤掉
的
分区
中
的
数据吗?
浏览 29
提问于2020-11-16
得票数 0
2
回答
如何将分片
bigquery
表
作为
DBT
源加载
、
、
我是
dbt
新手,在
BigQuery
中
,我可以使用asterix查询大型数据集中
的
分区
表
。例如:asterix代表年份和月份,例如202211。如
何在
dbt
中
为此创建源。如果我使用代码-gen包,它会为每个月创建一个
表
,但我不想每个月更新它。 我读到了增量数据源,但我不确定这是否是我所需要
的
?有人能给我指明正确
的
方向吗。在.yml源代
浏览 11
提问于2022-11-22
得票数 0
回答已采纳
1
回答
BigQuery
:查询
最新
的
分区
、要处理
的
字节和实际处理
的
字节
、
、
我很难有效地查询
表
的
最后一个
分区
,使用日期或日期时间字段。
的
处理估计,这会
扫描
整个
表
,而不使用
分区
。甚至Google在他们
的
文档
中
也提到了这一点。如果我对
分区
使用确切
的
值,它就会工作:FROM my_table但是,如果
表
不是
最新
的
浏览 0
提问于2020-07-15
得票数 0
2
回答
如何使用
DBT
在
BigQuery
中
对表进行
分区
、
、
、
我是
DBT
的
新手,以前一直在使用气流进行数据转换。在气流
中
,有一个名为{{ ds }}
的
变量,它代表这种形式
的
逻辑日期,YYYY-MM-DD和{{ ds_nodash }},它们代表这种形式
的
YYYYMMDD
中
的
逻辑日期。my_project.my_dataset.my_table_new${{ ds_nodash }}', dag=dag )
浏览 13
提问于2022-01-28
得票数 3
回答已采纳
1
回答
谷歌BigTable
的
模式设计
、
、
在我
的
项目中,我使用
的
是谷歌
BigQuery
,它保存了大量
的
数据。
BigQuery
列是: account_id,session_id,transaction_id,用户名,事件,时间戳。在我
的
仪表板
中
,我根据时间戳(最后30天)获取
整个
数据。因为我有非常大
的
数据,所以性能非常慢(获取最后30天
的
数据需要13秒)。在我
的
测试
中
,BigTable
的
性能比
Big
浏览 3
提问于2022-05-25
得票数 0
1
回答
如果我在内部联接中使用where子句,为什么没有性能差异?
、
、
基本上,我有两种不同类型
的
查询。唯一
的
区别就是过滤X值。当我在table2
中
过滤X值时,table2
的
大小几乎是一半。因此,当我应用"where“子句时,我
的
期望是看到数据字节
的
减少。然而,当我运行--dry_run在烧烤cli。我得到了完全相同
的
数据字节。 Query successfully validated.有人能解释一下为什么我
的
处理数据大小完全一样吗?
浏览 0
提问于2019-09-23
得票数 0
回答已采纳
1
回答
选择
最新
分区
的
数据(按日期划分),而
不
扫描
完整
的
雅典娜
表
。
、
、
我是否可以从
最新
的
分区
(按日期划分)中
选择
数据,而不需要
扫描
完整
的
雅典娜
表
?我希望根据
最新
的
分区
(以及按日期划分
的
分区
)从
表
中
选择
数据,我可以从“Database.table.partitions”
中
通过
选择
max(date_p)获取
最新
的
分区
,这需要一些M
浏览 2
提问于2022-10-14
得票数 0
8
回答
如
何在
BigQuery
表
中
选择
最新
的
分区
?
我正在尝试从日期
分区
的
BigQuery
表
中
的
最新
分区
中
选择
数据,但是查询仍然从
整个
表
中
读取数据。我尝试过(据我所知,
BigQuery
不支持QUALIFY): SELECT pt FROM (SELECT col from table WHERE _PARTITIONT
浏览 23
提问于2016-09-27
得票数 15
回答已采纳
2
回答
为什么今天集群/
分区
上
的
查询成本比以前
的
日期要高得多?
我有一个
分区
/集群
表
如下:当我运行这个查询时: projectId `projectId.dataset.tables`为了确保
分区
具有相同
的
大小,我计算了每个
分区
中
的
projectId数。
分区
的
行数比前两天还要少。 SELECT projectId FROM `proj
浏览 3
提问于2019-03-17
得票数 4
回答已采纳
3
回答
选择
“如果存在于何处DATE=TODAY,如果不存在DATE=YESTERDAY”
例如,我有一个包含一些列
的
表
和一个日期列(我用它创建了一个
分区
)。[Amount, Date ] [3 , 2020-4-2] 我想根据日期得到
最新
的
金额。我想用ORDER BY做一个ORDER BY,但是,这是由
BigQuery
优化
的
,还是会
扫描
我
的
整个
表
?我想尽可能地避免成本,我想要根据今天
浏览 3
提问于2020-04-01
得票数 1
回答已采纳
1
回答
如何将数据附加到
BigQuery
表
中
的
现有
分区
我们可以在
BigQuery
表
上创建一个
分区
,同时创建一个
BigQuery
表
。 如何将数据附加到
BigQuery
表
中
的
现有
分区
。如果现有的
BigQuery
表
中
已经存在
分区
,如
何在
该
表
中
创建新
的
分区</em
浏览 8
提问于2017-11-08
得票数 1
1
回答
如
何在
Azure
表
中
检索
最新
的
行?
、
、
我正在尝试检索Azure自动创建
的
主分钟度量表
中
创建
的
最新
行。有没有办法在
不
扫描
整个
表
的
情况下
做到这一点?
分区
键基本上是不同格式
的
时间戳。例如:但是,我没有办法知道
最新
的
分区
键是什么,所以我不能只按
分区
查询。此外,行键也没有用,因为所有行都有相同
的
行键。我完全不知
浏览 0
提问于2015-12-03
得票数 1
1
回答
在
BigQuery
中
显示配置单元
分区
的
替代方案
、
我有一个需求,我在
BigQuery
(每小时
分区
)中有一个
分区
表
,并且我必须编写一个批处理作业,该作业将一次处理一个
分区
。 在配置单元
中
,我可以像在主表和一个元数据
表
中
显示
分区
一样,很容易做到这一点。在这个
表
中
,我可以维护已处理
分区
,稍后使用except在两个数据集之间创建一个差异,以标识要处理
的
其余
分区
。我在
BigQuery
<e
浏览 14
提问于2020-11-19
得票数 0
回答已采纳
5
回答
BigQuery
表
的
索引
、
我有一个用例,其中我们在
BigQuery
中有几个
表
。现在,我想在
BigQuery
表
中
的
一个列上实现一个索引。但我找不到足够
的
文件来做这件事。我发现一些博客和帖子提到
BigQuery
不支持索引。请帮我找到一个博客或帖子,可以帮助我在
BigQuery
上实现索引。提前谢谢。
浏览 3
提问于2015-02-19
得票数 18
回答已采纳
2
回答
如何减少
BigQuery
在查询期间
扫描
的
数据量?
、
、
请有人告诉并解释以下多重
选择
问题
的
正确答案? 您有一个查询,它使用时间戳和ID列上
的
WHERE子句过滤
BigQuery
表
。通过使用bq query –-dry_run,您了解到查询会触发对表
的
完整
扫描
,即使时间戳和ID上
的
筛选器
选择
了
整个
数据
的
一小部分。您希望减少
BigQuery
扫描
的
数据量,同时尽量减少对现有SQL查询
的
更改。
浏览 3
提问于2019-10-26
得票数 1
2
回答
为什么
BigQuery
在WHERE子句只引用一列
的
情况下
对` `SELECT *`执行全
表
扫描
?
在提供WHERE子句
的
情况下
,为什么
BigQuery
要对SELECT *执行全
表
扫描
?SELECT *WHERE login='__ThisUserDoesNotExist__' 该查询执行全
表
扫描
,即使它实际上只需要对login列进行完整
扫描
,以确定没有要返回
的
记录。有兴趣参考BQ文档
的
相关章节以及关于柱状数据库
的<
浏览 1
提问于2021-01-18
得票数 0
2
回答
Bigquery
定价比较:将数据加载到
Bigquery
使用Create外部
表
、
我
的
团队正在使用Google平台开发数据平台。我们将公司
的
数据上传到上,并尝试在
Bigquery
上创建数据集市。但是,为了节省GCP
的
使用成本,我们考虑将所有数据从gcs加载到
bigquery
,或者在
bigquery
上创建外部
表
。 哪种方式更符合成本效益?
浏览 6
提问于2022-02-25
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券