腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
BigQuery
中
使用
HyperLogLog
函数
可以
从
相同
数据
的
相同
查询
中
获得
不同
的
结果
吗
?
、
我
的
查询
如下所示: SELECT HLL_COUNT.MERGE((SELECT HLL_COUNT.INIT(key.item) FROM UNNEST(data.list) key)),FROM dataset 假设我运行这个
查询
10000次(
在
同一组
数据
上),我会得到10000个
相同
的
结果
,还是只有一小部分时间我可能会得到略有
不同
的
输出?
在
documentation
中
浏览 11
提问于2021-01-13
得票数 1
回答已采纳
1
回答
BigQuery
新用户计数与显示
的
Firebase分析
数据
有很大差异
、
、
在
我
的
考察
中
,我发现在1月14日之后,谷歌
BigQuery
和谷歌Firebase Analytics
的
新用户数量有很大
的
不同
。这种差异高于传统
的
0.5-2%
的
比率,这
可以
归因于用于提高计算速度
的
HyperLogLog
算法。我找不到一个确切
的
答案,关于如何在Firebase Analytics上计算新用户来创建
相同
的
查询<
浏览 21
提问于2020-02-03
得票数 1
1
回答
Google Analytics差异
、
我有目标完成
的
谷歌分析报告,这与我
在
BigQuery
上看到
的
不同
。我正在
使用
下面的
查询
来
获得
目标完成。差异非常小,大约在1到20之间。时区会带来
不同
吗
?
浏览 3
提问于2021-04-30
得票数 0
2
回答
如何
使用
数据
流运行器将
hyperLogLog
字段
从
ApacheBeam保存到
BigQuery
、
、
、
、
我需要将所有草图
从
ApacheBeam保存到
BigQuery
中
。但是我找不到一种方法将素描本身保存到
BigQuery
。为了能够稍后通过时间滑动将其与合并
函数
和其他
函数
一起
使用
:请参阅此 .apply("hll-count", Combine.perKey(ApproximateDistinct.ApproximateDis
浏览 8
提问于2019-04-04
得票数 0
1
回答
从
BigQuery
查询
和
使用
云存储
的
结果
加载文件
的
成本有什么
不同
?
、
、
我们
可以
使用
预定义
的
方法-> see docs
从
Google
BigQuery
中
查询
任何语言
的
结果
。或者,我们也
可以
查询
结果
并将其存储到云存储
中
,例如在.csv -> see docs on storing data to GCS
中
当我们反复需要提取
相同
的
数据
时,例如每天100次
浏览 28
提问于2019-12-13
得票数 0
2
回答
从
从
google分析导出到
bigquery
的
数据
的
每一页中计数会话
、
我一直试图
使用
bigquery
计算每个页面的会话,其中
数据
从
GA导出到
bigquery
。
数据
的
架构
可以
找到。GA
中
得到
的
数字进行了比较,但
结果
是完全
不同
的
。,但与我
从
GA得到
的
数字不完全
相同
。
在
我
的
例子
中
没有采样,否则
结果
是
可以</
浏览 5
提问于2016-08-25
得票数 0
1
回答
BigQuery
到Data事件“first_open”
的
差异
、
、
、
我们已经将
数据
从
(事件)导出到
BigQuery
,以便在data中
使用
。当我们尝试将
数据
与
BigQuery
/DataStudio与Firebase控制台匹配时,除了事件之外,实际上每个事件总数都匹配。 对此有什么解释
吗
?
浏览 0
提问于2019-10-16
得票数 0
回答已采纳
2
回答
BigQuery
中极限子句
的
随机性
我
在
BigQuery
中
的
大型表中
使用
限制子句。我已经读过,
BigQuery
将获取
数据
的
工作分配给多个工作人员,每个人都
可以
从
数据
的
不同
部分读取,因此我认为
使用
限制子句时应该存在随机性。但是,当我多次尝试
相同
的
查询
时,我得到了
相同
的
结果
。我很
浏览 5
提问于2020-02-28
得票数 1
回答已采纳
0
回答
向已分区
的
BigQuery
表添加
数据
并对其进行
查询
、
、
在
BigQuery
中
,我创建了一个分区
数据
表(按小时分区),当
数据
进入其中时,
结果
似乎没有_PARTITIONTIME伪列;当我这样做时 _PARTITIONTIME AS pt,* [my_dataset.my_partitioned_table] 1000 我
获得
了表
中
的
所有常规列,但是每个条目的_PARTITIONTIME都为null。
从
对Go
BigQu
浏览 2
提问于2016-07-15
得票数 1
回答已采纳
1
回答
统计GDELT
数据
库
中
的
事件(抗议)数量
、
我
的
目标是
获得
2004年至2020年期间墨西哥每月报告
的
抗议活动数量。我正在
使用
Google
BigQuery
从
GDELT
数据
库
中
获取这些
数据
。我
的
问题是,当在
不同
的
表上运行
相同
的
查询
时,我会得到
不同
的
结果
。TIMESTAMP('2020-12-31')
浏览 90
提问于2021-08-23
得票数 0
3
回答
在
谷歌
BigQuery
中流式传输PostgreSQL表
、
、
我想自动将
数据
从
外部PostgreSQL
数据
库传输到我
的
GCP帐户
中
的
Google Cloud Platform
BigQuery
数据
库。到目前为止,我已经看到
可以
使用
EXTERNAL_QUERY()
函数
查询
外部
数据
库(MySQL或PostgreSQL),例如:https://cloud.google.com/
bigquery
浏览 26
提问于2021-04-01
得票数 2
1
回答
是否
可以
在
Data Studio计算中
使用
BigQuery
重复字段?
、
在
BigQuery
表
中
,表
的
第1行包含以下
数据
: [ "order_key": "4416", { "id":看起来,为了
获得
这些
数据
,data Studio交叉连接所有的
数据
,以便解压嵌套
的
值。这会导致返回错误
的
总数。如果我查看Data Studi
浏览 10
提问于2019-05-14
得票数 2
回答已采纳
1
回答
HyperLogLog
交叉口:为什么不
使用
min?
在
两个兼容
的
HyperLogLog
对象之间进行联合时,只需
使用
最大桶即可完成不引入任何新错误
的
无损联合:IntersectionCountEstimate = A.CountEstimate() + B.CountEstimate() - Union.CountEstimate() 为什么
使用
最小桶值不能作为有效
浏览 3
提问于2015-03-08
得票数 2
回答已采纳
2
回答
计数
BigQuery
中
的
distinct concat
、
我
在
BigQuery
:Count distinct concat(col1,col2,col3,col4,col5)
中
尝试过PostgreSQL:count distinct (col1,col2,我
的
场景是我需要在
BigQuery
中
获得
与PostgreSQL
相同
的
结果
虽然此场景适用于3列,但我无法
获得
与5列
的
PostgreSQL
相同
的
值。示
浏览 17
提问于2019-12-09
得票数 0
2
回答
写入
BigQuery
我
的
问题是关于
从
BigQuery
标准SQL写入
BigQuery
。 我有一个要求,我必须在Standard中进行一些计算。在这些计算之后,我必须将这些计算
数据
保存到
BigQuery
。
从
标准SQL中将
数据
插入
BigQuery
的
标准方法是什么?
浏览 2
提问于2017-03-27
得票数 0
回答已采纳
2
回答
Presto对approx_distinct
的
支持
、
、
我正在为大规模
数据
(大约100 on )上
的
分析
查询
(交互式和批处理)评估分布式
查询
引擎。其中一个需求是count-distinct
查询
的
低延迟(<= 1s),其中近似
结果
(误差不超过5% )是可接受
的
。 Presto似乎通过它
的
approx_distinct()来支持这一点。据我所知,它
使用
HyperLogLog
实现这一点。但是,除非
数据
与
HyperLogLog</
浏览 8
提问于2017-08-14
得票数 0
2
回答
如何
使用
关键字限制
在
大
查询
和python
中
获取
数据
时不重复
的
行
、
、
我有数百万行,其中log是唯一
的
id。为了处理
数据
并保存到另一个表
中
,我正在做如下操作actions_full = pandas_gbq.read_gbq(action, project_id='mt-int') 处理完
数据
后,
浏览 36
提问于2020-07-05
得票数 0
2
回答
大
查询
:列名不明确
、
、
、
好吧,我是SQL和Big Query
的
新手,我得到了一个不明确
的
列名错误。我已经检查了堆栈溢出
的
其他答案,但无法找到/理解我
的
问题
的
答案。所以我得到:错误: 2.40 - 2.68:不明确
的
列名subreddit。as NumOverlaps FROM (TABLE_QUERY([fh-
bigquery
HAVING cnt > 5)
浏览 6
提问于2018-03-05
得票数 2
1
回答
运行时成千上万个大型
数据
集
的
Jaccard相似算法
、
、
、
、
我所需要
的
我认为有两种可能
的
解决办法:
使用
MinHash算法。这个解决方案
的
问题是它非常
浏览 6
提问于2017-04-03
得票数 2
1
回答
如何更改
BigQuery
作用域?
、
、
我正在尝试编写一个
从
BQ
中
的
联邦表中提取
数据
的
查询
。
在
BQ
中
,我
可以
运行
查询
并
获得
结果
。但是,当我
在
Domo
中
运行
相同
的
查询
时,我得到错误: Domo已准备好,但收到访问被拒绝:
BigQuery
BigQuery
: No OAuth token with
浏览 1
提问于2018-11-10
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券