我有一个带有人口的250×250米网格的表格t1,我想计算每个州的百分位数。我已经有了每个单元格的state_id (st_contains)。现在我要计算每个状态的百分位数。解决方案,添加分区;) ntile(100) OVER(PARTITION BY state_id ORDER BY pop) as percentile
FROM
我在谷歌的BigQuery中有以下SQL查询: SELECT date, perc, 0.2) OVERPARTITION BY sensor, date) AS percentile80_day sensordata Sensor, time 现在,我想要添加的另一个计算是两个百分位数之间的平均值在此特定情况下,是
非常简单,假设我想要对一个组中的一个特征进行求和。所以我在一个窗口函数上进行分区: SELECT sum(NumberOfPlayers) over (partition by sport) as SumOfSport 太好了,这很好。现在.。我想知道这笔和在我刚刚做的所有总和中的百分位数。 例如,一项有9名运动员的运动,在五项运动中排名第二,将处于第40个百分位数。 让我们从简单的开始..我想知道
我希望为每一行分配一个索引/组号,指示它属于哪个百分位数。例如,我现在的代码是: (int)(100*(PERCENT_RANK() OVER(ORDER BY Revenue)))/5 AS Percentile然而,使用等距间隔意味着行数是不均匀的,因为第一个间隔比其他间隔有更多的行,因为数据中有许多行具有Revenue=0。例如,使用Percentile=0的<