腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
数据仓库技术
专栏成员
举报
116
文章
47286
阅读量
29
订阅数
订阅专栏
申请加入专栏
全部文章(116)
数据(80)
sql(62)
面试(61)
大数据(55)
函数(50)
排序(19)
date(18)
select(15)
time(14)
登录(14)
统计(11)
hive(7)
数学(6)
腾讯(6)
字符串(6)
leetcode(5)
list(5)
null(5)
row(5)
view(5)
基础(5)
数据仓库(5)
语法(5)
friend(4)
join(4)
百度(4)
数组(4)
数据分析(3)
explode(3)
sum(3)
测试(3)
模型(3)
日志(3)
access(2)
spark(2)
hadoop(2)
微信(2)
distance(2)
payment(2)
rank(2)
部署(2)
解决方案(2)
配置(2)
数据类型(2)
搜索(2)
搜索引擎(1)
unix(1)
企业(1)
安全(1)
apple(1)
click(1)
code(1)
com(1)
count(1)
datediff(1)
dt(1)
gpt(1)
hiveql(1)
int(1)
ip(1)
lag(1)
mac(1)
max(1)
meta(1)
min(1)
partition(1)
pear(1)
pivot(1)
pool(1)
product(1)
set(1)
sign(1)
stock(1)
timestamp(1)
union(1)
unpivot(1)
编译(1)
产品(1)
翻译(1)
服务器(1)
工作(1)
管理(1)
华为(1)
环境搭建(1)
技巧(1)
集群(1)
可视化(1)
框架(1)
内存(1)
苹果(1)
软件(1)
设计(1)
实践(1)
事件(1)
手机(1)
同步(1)
微信公众号(1)
异常(1)
主机(1)
搜索文章
搜索
搜索
关闭
开窗函数 spark sql实现累加、累积计数、累乘
排序
sql
spark
date
函数
前面对开窗函数做了基础知识介绍,今天我们对其应用做详细介绍。通过开窗函数实现累积求和(累加),累积计数,累乘(累积相乘)。
数据仓库晨曦
2025-03-04
73
0
详解spark开窗函数
com
函数
框架
排序
spark
窗口函数(Window functions)又称分析函数或开窗函数,它允许你在不改变原始行的情况下,对一组相关的行(称为“窗口”)进行计算和分析。与普通的聚合函数(如SUM、AVG等)不同,窗口函数不会将多行合并为一行,而是为每一行返回一个计算结果,同时保留原始行的详细信息。通常写法为func()over(),详细语法如下:
数据仓库晨曦
2025-02-26
50
0
留存专题-1~180日留存数仓设计
数据
date
null
登录
设计
计算1~180天留存率数据仓库设计方案。在实际业务场景中可能是计算 1、3、7、14、30、60、90、180日留存这种方式,也可能是1~180连续每天都要计算,当然极端情况下也会有1~360日留存的计算。主要讲述建设思路。文章以1~7日数据进行计算了展示,计算180日留存时需要调整数据周期。
数据仓库晨曦
2024-12-19
116
0
留存专题-计算1~7日留存率
datediff
select
数据
count
date
我们使用留存专题-基础数据生成数据,计算2024-01-01日~2024-01-07日新增用户的1日、2日、3日、4日、5日、6日、7日留存率
数据仓库晨曦
2024-12-19
73
0
留存专题-基础数据生成
基础
数据
date
登录
函数
为完成留存数据,我们需要先准备相关数据,包含三份数据:日期维表、新增用户表、用户登录表。生成数据涉及不少知识点,之前基本都写过了,这里不再赘述。涉及函数如下。 space() split() posexplode() random() datediff() pow()
数据仓库晨曦
2024-12-19
74
0
LeetCode面试SQL-给定数字的频率查询中位数
面试
数据
sql
leetcode
函数
在此表中,数字为 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 2, 3,所以中位数是 (0 + 0) / 2 = 0。
数据仓库晨曦
2024-10-14
91
0
LeetCode面试SQL-平均工资-部门与公司比较
数据
sql
leetcode
函数
面试
给如下两个表,写一个查询语句,求出在每一个工资发放日,每个部门的平均工资与公司的平均工资的比较结果 (高 / 低 / 相同)。
数据仓库晨曦
2024-10-10
121
0
LeetCode面试SQL-获取最近第二次活动
sql
date
leetcode
面试
数据
该表不包含主键 该表包含每个用户在一段时间内进行的活动的信息 名为 username 的用户在 startDate 到 endDate 日内有一次活动
数据仓库晨曦
2024-10-09
103
0
连续问题SQL-券商场景-合并用户连续交易日期
数据
sql
date
select
排序
本题是券商实际工作中的场景,依旧是连续问题,解决方法在一文搞懂连续问题中都有提到,但是该题目相对较难,是几个问题的混合。
数据仓库晨曦
2024-10-09
140
0
LeetCode面试SQL-用户购买平台
手机
sql
date
leetcode
面试
写一段 SQL 来查找每天 仅 使用手机端用户、仅 使用桌面端用户和 同时 使用桌面端和手机端的用户人数和总支出金额。
数据仓库晨曦
2024-09-24
100
0
LeetCode面试SQL-学生地理信息报告
数据
sql
leetcode
函数
面试
一所美国大学有来自亚洲、欧洲和美洲的学生,他们的地理信息存放在如下 student 表中。
数据仓库晨曦
2024-09-24
79
0
行列转换-横表竖表互相转换
sum
基础
数据
数学
语法
原始数据中是一个竖表,每个学生的每个学科一行数据,对其转换成一张横表,即表中学生id为主键,包含语文、数学、英语三列,列值为对应学科分数。
数据仓库晨曦
2024-09-12
114
0
sparksql-unpivot子句介绍
int
null
unpivot
函数
语法
今天给大家带来spark的一个新的知识点,UNPIVOT,这个不是函数,是一个子句。
数据仓库晨曦
2024-09-11
121
0
sparksql-pivot子句介绍
语法
null
pivot
函数
数据
PIVOT 子句用于数据透视。我们可以根据特定列的值获取聚合值,这些值将转变成在 SELECT 子句中使用的多个列。PIVOT 子句可以在表名或子查询之后指定。
数据仓库晨曦
2024-09-10
124
0
常见大数据面试SQL-物流线路分析SQL
面试
数据
sql
大数据
time
该题目难度不高,但是计算起来比较麻烦,但是实际业务中这样的加工相对常见。面试遇到这样的题目,说明团队相对比较务实,但是日常工作可能也是类似繁琐内容较多。在面试过程中,从内容理解和解题上,都属于内容量比较多的。
数据仓库晨曦
2024-09-10
152
0
常见大数据面试SQL-分组连续累积计数
数据
sql
大数据
基础
面试
有temp表包含A,B两列,请使用SQL对该B列进行处理,形成C列,按A列顺序,B列值不变,则C列累计计数,C列值变化,则C列重新开始计数,期望结果如下
数据仓库晨曦
2024-09-10
139
0
常见大数据面试SQL-近30天连续登陆3天以上次数-非开窗
date
登录
面试
sql
大数据
有用户登录记录,已经按照日期去重。求近三十天,用户连续登录超过3天的次数,一直连续登录算一次,有间隔然后重新计算次数, 要求不能用开窗
数据仓库晨曦
2024-08-27
188
0
列转行-lateral view outer posexplode及posexplode_outer多列对应转行
数据
distance
list
payment
view
现有骑手id,订单id列表,订单配送距离列表,配送费列表,其中订单id、配送距离、配送费一一对应。
数据仓库晨曦
2024-08-27
114
0
列转行-posexplode多列对应转行
数据
distance
list
payment
函数
现有骑手id,订单id列表,订单配送距离列表,配送费列表,其中订单id、配送距离、配送费一一对应。
数据仓库晨曦
2024-08-21
121
0
列转行-explode_outer及lateral view outer
函数
数据
explode
list
view
现有骑手id,订单id列表,订单配送距离列表,配送费列表,其中订单id、配送距离、配送费一一对应。
数据仓库晨曦
2024-08-20
126
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档