我有一个用例,我需要对滑动窗口上的一列(让我们称之为X)进行百分位数的计算。因此,窗口定义是按时间顺序排列的-持续120天: days = lambda i: i * 86400
w = Window.partitionBy("entityId").orderBy(F.col("trn_time").cast("long").asc())
.rangeBetween(-days(120),-days(1)) 我考虑过使用approxQuantile,但它是一个数据帧函数。第二种选择是使用: percent_rank().over(w)