首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【阅读笔记】数据分析思维:分析方法和业务知识

例如某数据在2020年12月比2019年12月下降10% 在进行比较时,要注意比较对象的规模要一致。...群组分析方法是按某个特征,将数据分为不同的组,然后比较各组的数据。 作用 群组分析方法常用来分析用户留存率(流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。...在金融行业,群组分析还可用于用户逾期分析 如何用 先试用群组分析方法,找到留存率低或者留存率高的组;然后就可以使用假设检验、相关分析等方法,研究为什么这些组留存率低或留存率高。...使用原始数据计算出R、F、M值。...给R、F、M值按价值打分,例如按价值从低到高分为1~5分。 计算价值的平均值,如果某个指标的得分比价值的平均值低,标记为“低”。如果某个指标的得分比价值的平均值高,标记为“高”。

98910

这套烧脑的数学模型,教你如何预测一个互联网产品的未来

a是幂函数下降的起点值,在留存率趋势来说就是我们常说的次日(周,月)留存率,下面我们以 C 来代表这个值。 b 是幂指数衰减的趋势,代表留存率的衰减速度,我们以 R 来代表这个值。...:留存率= 43.7x^{-0.53307}, (其中 C=43.7,R=-0.53307) 在实际使用过程中,通过已有几日(周,月)的留存数据,按照模型就可以反算出 C 值和R 值,从而推算出将来几日...* 历史月到预测当月的留存预测值 历史月到预测当月的留存预测值 是通过留存率模型中C值和R值来计算的。...预测的方法上面已经说清楚了,用下面的几张表格说明具体计算的过程,我们根据 2015年10月 份到 2月 份的产品数据来预测 2016年4-6月 份的 DAU 数据: 1.根据现有的留存数据计算留存率参数...如图中可以看到,为了计算 16年6月 的 MAU,需要把这之前的所有月份(2015年10月 到 2016年5月)到 2016年6月 份留存下的用户全计算出来。 3.累计历史留存用户,计算 MAU ?

3.4K91
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    花了一周,我总结了120个数据指标与术语。

    △点击查看大图 用户留存类指标共有15个:用户留存率、渠道留存率、次日留存率、退出率、活跃度、活动参与率、活跃交易用户数、DAU、MAU、用户回访率、用户流失率、功能使用率、GMV、复购率、退货率,这些指标具体含义如下图所示...统计学常用语 绝对数和相对数 绝对数:是反应客观现象总体在一定时间、一定地点下的总规模、总水平的综合性指标,也是数据分析中常用的指标。比如年GDP,总人口等等[4]。...相对数的计算公式: 相对数=比较值(比数)/基础值(基数) 百分比和百分点 百分比:是相对数中的一种,它表示一个数是另一个数的百分之几,也称为百分率或百分数。...连续变量 在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。...离散变量 离散变量的各变量值之间都是以整数断开的,如人数、工厂数、机器台数等,都只能按整数计算。离散变量的数值只能用计数的方法取得。

    1.6K32

    分享一个能够写在简历里的企业级数据挖掘实战项目

    ,⽐如,将几万个样本分成100组,或50组(尽量有监督的分箱) 确保每⼀组中都要包含两种类别的样本,否则IV值会⽆法计算 我们对相邻的组进⾏卡方检验,卡方检验的P值很大的组进⾏合并,直到数据中的组数⼩于设定的...计算Cr的IV值 以计算用户转化率为例,进行WOE分箱并计算对应的IV值。通过分析得到如下结论。 用户转化率在小于1.14%时用户留存较多。...H 访问时间点 访问时间点在上午时,客户留存效果并不好,在晚上7点后访问的客户,流失率少,且随着时间点推移,留存在明显增大,在凌晨时仍存在留存客户优势。...R就是一年内距离上次下单时长为轴,其两端留存和流失客户均很多,且 R 等于 1 就是距离时间越久,客户流失就越少,与我们用WOE分箱分析结果一致。...,1.925)区间 访问时间在上午 App订单数在2.61以上 年访问次数在小于15000 年消费越大 入住日期与访问日期间隔越短 附录如何选择算法 如何选择聚类算法 如果数据集是高维的 —— 谱聚类,

    1.8K31

    分享一个能够写在简历里的企业级数据挖掘实战项目

    ,⽐如,将几万个样本分成100组,或50组(尽量有监督的分箱) 确保每⼀组中都要包含两种类别的样本,否则IV值会⽆法计算 我们对相邻的组进⾏卡方检验,卡方检验的P值很大的组进⾏合并,直到数据中的组数⼩于设定的...计算Cr的IV值 以计算用户转化率为例,进行WOE分箱并计算对应的IV值。通过分析得到如下结论。 用户转化率在小于1.14%时用户留存较多。...H 访问时间点 访问时间点在上午时,客户留存效果并不好,在晚上7点后访问的客户,流失率少,且随着时间点推移,留存在明显增大,在凌晨时仍存在留存客户优势。...R就是一年内距离上次下单时长为轴,其两端留存和流失客户均很多,且 R 等于 1 就是距离时间越久,客户流失就越少,与我们用WOE分箱分析结果一致。...,1.925)区间 访问时间在上午 App订单数在2.61以上 年访问次数在小于15000 年消费越大 入住日期与访问日期间隔越短 附录如何选择算法 如何选择聚类算法 如果数据集是高维的 —— 谱聚类,

    1.6K30

    投稿丨教你从0到1搭建SaaS产品运营体系

    探究三:如何迭代与优化产品 留存,顾名思义,就是用户在你的网站/APP中留下来、持续使用的意思。通过产品留存分析,我们可以掌握用户对不同产品功能的使用粘性与活跃度,从而进行产品迭代和优化。...3.3找到产品增长的Magic Number 在硅谷的增长黑客实践中,有一组Magic Number(魔法数字)被人津津乐道。那么这组数字到底是一种怎样的存在呢?...其实Magic Number就是一组用户行为的组合,它揭示了用户在规定时间内对某个产品功能进行了N次操作的状态。那么如何找到SaaS产品的Magic Number呢? ?...通过机器学习的方法,计算出用户的留存度和用户行为(组合)之间的相关系数。如果系数在0.4-0.6之间,表示两者正相关;如果系数大于0.6,表示两者强相关。...在正向相关的用户行为(组合)中找到具有业务意义、可操作性的一组,作为促进你产品增长的Magic Number。

    3.6K40

    开发 | Python赶超R语言,成为数据科学、机器学习平台中最热门语言?

    AI科技评论将kdnuggets上发表的总结文编译整理如下: 之前我们在kdnuggets上做了这样一个问卷调查,2016、2017两年,在分析、数据科学和机器学习的工作中,你用R语言,还是Python...2016年使用Python的用户中,有91%的人2017年还在继续使用它,而R语言的用户留存率为74%,其他语言的用户留存率则为60%。...因为我们2015年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面2014-2016这四年的对比趋势图中,2016、2017年的Python、R语言使用趋势我们是这样计算的...图3:2014-2017年,Python、R语言及其他语言在分析、数据科学和机器学习的使用情况对比 最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下: 美国/加拿大,40% 欧洲,35%...亚洲,12.5% 拉美,6.2% 非洲/中东,3.6% 澳洲/新西兰,3.1% 为了简化对比图,我们将同时使用R语言和Python的比例也按照上面的计算方法折算到单独使用R语言和Python的比例中,并把亚洲

    63690

    Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

    有关此次问卷更具体的情况如何?...AI研习社将 kdnuggets 上发表的总结文编译整理如下: 之前我们在 kdnuggets 上做了这样一个问卷调查,2016、2017 两年,在分析、数据科学和机器学习的工作中,你用 R 语言,还是...2016 年使用 Python 的用户中,有 91% 的人 2017 年还在继续使用它,而 R 语言的用户留存率为 74%,其他语言的用户留存率则为 60%。...因为我们 2015 年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面 2014-2016 这四年的对比趋势图中,2016、2017 年的 Python、R 语言使用趋势我们是这样计算的...图 3:2014-2017 年,Python、R 语言及其他语言在分析、数据科学和机器学习的使用情况对比 最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下: 美国 / 加拿大,40% 欧洲

    65970

    链家面试题:如何分析留存率?

    现在该手机厂商想要分析手机中的应用(相机)的活跃情况,需统计如下数据: 某日活跃用户(用户id)在后续的一周内的留存情况(计算次日留存用户数,3日留存用户数,7日留存用户数) 指标定义: 某日活跃用户数...N日活跃留存率,N日留存用户数/某日活跃用户数 例:登陆时间(20180501日)去重用户数10000,这批用户在20180503日仍有7000人活跃,则3日活跃留存率为7000/10000=70% 所需获得的结果格式如下...该业务分析要求查询结果中包括:日期(说明是按每天来汇总数据)、用户活跃数、N日留存数、N日留存率。 1.每天的活跃用户数 先来看活跃用户数这一列如何分析出?...次日留存用户数 再来看查询结果中的次日留存用户数 次日留存用户数:在今日登录,明天也有登录的用户数。也就是时间间隔=1。...时间间隔from c)group by a.登陆时间; 将临时表c的sql代入上面就得到了查询结果如下: 3.次日留存率 留存率=新增用户中登录用户数/新增用户数,所以次日留存率=次日留存用户数/当日用户活跃数

    3.1K10

    数据分析方法论|利用对比分析有效地说明数据结果和结论

    各个指标如何计算,我们这里就不在赘述。...通常情况下,在数据分析中会用同比增长率衡量业务趋势,其计算公式如下: 同比增长率 = (本期数据-上年同期数据) / 上年同期数据 * 100% 例如,2020年11月的GMV与2019年11月的GMV...,这种方法在实际的数据分析中更为常用,可以是不同版本之间的比较,量化版本变更带来的实际效益;也可以是活动前后的比较,量化活动开展是否达到预设目标;当然还可以是广告投放前后用户留存率的比较,以评判广告买量用户的效果...-在用户层面,可以将用户进行分组,对比不同组别用户在某一指标下的差异;也可以选定一个用户群体,比较该用户群体在不同天的留存率表现,即同期群分析。...例如,我们不能用抖音2020年的平均留存率与快手2019年的平均留存率相比,因为指标口径范围不同;同样地,我们也不能用2020年抖音的用户留存率与流失率进行比较,因为指标计算方式不一致;另外指标的单位也是容易忽略的点

    1.7K30

    数据分析中常见的数据陷阱 !!!

    项目组经理却确认为,这样的运动商品购物平台,在性别上不应该出现这么大的用户留存差异,甚至男生的留存率应该高于女生,于是让数据分析员做一个完整的调查报告(如下): 很容易看出,对于 AB 购物平台,分别分析性别留存率的时候男生都是大于女生...在分析时需要具体讨论注册的新增用户对我的收益大还是用户的留存率对我的收益大,可在分析时根据注册用户的多少设置分析留存的权重,或者说分析留存率时性别因素对于这一指标根本毫无影响甚至受别的因素干扰,需要去分析更多的因素...那如何避免罗杰斯现象呢,在如上的例子中,我们需要对比前后平均消费值升高的原因,找到原因后若确定是罗杰斯现象的产生,需要结合更多的因素来讨论某一行为的变化是否带给了我们想要的正向结果。...以显著性实验 T 检验为例, 假设 X1 表示实验组的用户新增,X2 表示对照组的用户新增,对于某实验采取 95%的置信区间,5%的假阳性概率(实验本身没有效果,但是计算出来结果是有效果的),此时计算...FDR(false discovery rate)错误发现率,表示在 n 次拒绝的结果中错误发现的比例的期望; 若原假设为真但被拒绝的检验次数为 R; 原假设为真但被接受的检验次数为 Q; 原假设为假但被拒绝的检验次数为

    1.9K11

    运营面试问题给你一个产品如何把它推爆,你们会怎么回答呢?

    在这一系列动作中,到底用户停留在了哪一步?是搜不到要的东西,还是创建账户太麻烦,或者是页面设置不合理?你要计算每个节点用户的流失率,来相应地提高产品性能,改善用户体验。...次日留存率:(当天新增的用户中,在第2天使用过产品的用户数)/第一天新增总用户数 第3日留存率:(第一天新增用户中,在第3天使用过产品的用户数)/第一天新增总用户数 第7日留存率:(第一天新增的用户中,...在第7天使用过产品的用户数)/第一天新增总用户数 第30日留存率:(第一天新增的用户中,在第30天使用过产品的用户数)/第一天新增总用户数 比如某个app第一天新增用户100个,第二天这100个人里有30...这一环节的指标有, 次日留存率:(当天新增的用户中,在第2天使用过产品的用户数)/第一天新增总用户数; 第3日留存率:(第一天新增用户中,在第3天使用过产品的用户数)/第一天新增总用户数; 第7日留存率...:(第一天新增的用户中,在第7天使用过产品的用户数)/第一天新增总用户数; 第30日留存率:(第一天新增的用户中,在第30天使用过产品的用户数)/第一天新增总用户数。

    2.4K00

    如何设计一个 AB test?

    根据实验的预期结果,大盘用户量,确定实验所需最小流量,可以通过一个网站专门计算所需样本量: 以次日留存率为例,目前大盘次日留存率 80%,预期实验能够提升 0.2pp (这里的留存率可以转换为点击率、渗透率等等...对于 ROI 的计算,成本方面,每个实验组成本可以直接计算,对于收益方面,就要和对照组相比较,假定以总日活跃天(即 DAU 按日累计求和)作为收益指标,需要假设不做运营活动,DAU 会是多少,可以通过对照组计算...在 AB 实验系统中通俗称作贯穿层。...这样分层后,我们可以按照如下的方式量化贡献: 计算春节活动的整体贡献:实验填充层-填充层填充组  VS  贯穿层-贯穿层填充组 计算活动 A 的贡献:活动 A 实验层中,实验组 VS 对照组 计算活动...B 的贡献:活动 B 实验层中,实验组 VS 对照组 业务迭代的同时,如何与自身的过去比较 上面谈到了【贯穿层】的设计,贯穿层的设计其实不但可以应用在多个活动的场景,有些场景,我们的业务需要和去年或上个季度的自身对比

    2.4K20

    详解SaaS产品的5类核心指标

    在SaaS业务中,通常按月或按年签订合同。 对于按月签订合同及少量的年度合同,采用MRR(Month Recurring Revenue,月度经常性收入)。...在MRR/ARR统计中,并不会计算一次性收入,例如定制的功能费用。 2. 如何计算MRR 将每个客户每月支付的费用相加得出MRR,公式如下。...如何计算CAC 将给定时间段中的营销和销售支出总额相加除以新客户总数,公式如下。...在SaaS中,我们会查看留存率随时间的变化趋势,并尝试找出导致高流失率的因素,从而改善客户留存情况。...每行代表一组用户,队列的名称在第一列(例如2021年1月)。 每列代表队列创建后的第几个月(第0个月是注册月份)。 每个单元格中的值为相对于前一个月的流失率或留存率。

    2.4K30

    SaaS 厂商关注 CAC<V,不如关注产品提高

    1 新的 LTV 计算公式 对于产生「负流失」的订阅式经济而言(相比流失中的收入损失,扩大收入来源在于高比例的客户留存),你需要新公式计算 LTV(包含扩张率和流失率)。...因此你可能会有 2014 年 1 月的群组,由 2014 年 1 月注册的所有客户组成。随后,我们需要跟踪有多少客户留存,一段时间内每个群组的收入走向如何。...下表通过三组月客户流失率走势展示出几年间某一群组客户数量情况。 ? 你会发现,该图走势呈指数衰减,在指数函数中,我们可以用一个简单的公式得到平均客户终身时间:平均客户终身时间=1/流失率 ?...如果我们将 10% 的年折扣带入到 SaaS 企业 10% 的年美元流失中,那么: ? 纵轴表示:初始群组合约价值百分比,以及每年如何以 10% 的流失率下滑。...在计算净利润率时,不要忘记将 COGS 和 CORE 带入。 如何计算一个正常客户的 CORE 值和净利润率 ? 现在净利润率变成了: ?

    1.3K60

    使用结构化分解的线性模型预测 dau

    1.对dau进行分解 对于一款成熟的产品,在渠道稳定的情况下,新增用户未来每天的留存率是基本稳定的。...某天dau中第n()天前回流用户的定义:对该天而言,沉默了n-1天后在当天活跃的用户。如对11.6而言,第2天前的回流用户为:所有只在11.4和11.6活跃的用户,并且在11.5不活跃。..._1499829560547.jpg] 然后在散点图中右键选择“添加趋势曲线”,选择合适的曲线,对回流率曲线,我这边得出的结论是基本符合幂规律,并选择“显示公式”、”显示R平方值”,然后就会得到一条非常优美的幂规律曲线..._9076_1499829615792.jpg] 如果你发现拟合的规律还不满意,可以进一步的把回流率按星期规律拆分成7条。...我的处理方法是认为所有工作日和假期的第0天新增留存率是相同的,实际上统计了部分数据后的确误差在1%以内。 4.dau预测计算 选定了预测起点后,就可以对后续天的dau进行迭代预测。

    5.4K22

    SaaS盈利的逻辑

    如果月流失率=1%,即年流失率=12%,意味着客户的平均生命周期约为8.3年。计算公式如下: 1/0.12≈8.3 即,客户生命周期=1/年流失率。...那么,如何判断一家SaaS公司的客户整体上是在流失,还是在复购?是在增购,还是在减购?使用范围是在扩大,还是在萎缩?收入留存率无疑是一个非常好的指标。...收入留存率的计算公式如下: 收入留存率=留存客户当前的年费收入/留存客户12个月前的年费收入 要计算收入留存率,首先需要锁定12个月前的留存客户。...到了2020年,这批客户只留存了800个,产生的年费收入是1800万元,那么: 收入留存率=1800万元/2000万元=90% 为了方便对比,我们也计算一下客户数量留存率: 客户数量留存率=800个/1000...说明我们还需要加大在百度搜索的投入,并积极探索其他搜索投放渠道。 除了按产品、按渠道进行分析,按客户类型进行分析也很重要。

    91620

    送给新手小白:11种数据分析方法,别再说你不会了

    当我们对两个变量进行分组研究时,在分组中都占优势的一方,在总评中反而成为失势的一方。...比较著名的当属1973年加利福尼亚大学伯克利分校性别歧视的例子,男生录取率为44%,女生录取率为35%,根据这个数据有人就觉得该校有性别歧视的倾向,但如果每个院系分开来看录取率的话,可以发现,A B D...5、对比分析 在进行对比分析时,主要考虑两个问题,和谁比,以及如何比。...需要注意的是,相关性并非因果性,现实生活中,100%的因果关系很难找到。如何判别是相关还是因果呢?答案就是:单变量控制法,控制其他因素不变,只改变一个因素,然后观察这个因素对结果的影响。...比如按时间分析留存率,目的是找到留存率低的组,然后进一步分析这些组。

    61210

    MySql场景面试题:电商业务中用户的行为路径和转化率分析

    按城市分组,统计每个城市的用户行为路径。 转化率分析: 计算以下转化率: 注册到首次购买转化率:注册用户中在2023年内完成首次购买的用户占比。...首次购买到第二次购买转化率:首次购买用户中完成第二次购买的用户占比。 复购用户到高价值用户转化率:复购用户中累计购买金额 ≥ 10,000 元的用户占比。...用户留存分析: 计算用户在首次购买后的第30天、60天、90天的留存率。 按城市分组,统计每个城市的用户留存率。...retention_analysis: 计算用户在首次购买后的第30天、60天、90天的留存率。 综合输出: 将用户行为路径、转化率和留存率结合,按城市输出最终结果。...转化率计算:通过条件聚合计算多级转化率。 留存率计算:使用 DATEDIFF 和条件聚合计算用户留存率。 多步骤数据处理:通过 WITH 子句分步骤处理数据,提升可读性和性能。

    8510

    《App数据分析到底要分析什么》

    笔者结合海外移动端产品的数据分析实践与MTA服务的客户案例,带你从产品初创到成熟不同阶段看数据分析如何应用于产品设计和产品运营。...案例: 拿之前做的某款国外移动端论坛社交应用为例,产品在idea时期(12,13年左右)发现了论坛用户经常在吐槽从移动端Wap页访问论坛速度慢、广告多、完全没有移动端适配,于是我们提出假设:做一个App...于是在初期,整个产品完全围绕看帖、发帖两个核心场景进行挖掘,在论坛里进行宣传,售价$18,发现有许多用户为之付费,且这些用户的留存率达到60%+(当然与用户付费了有关),有一半的用户使用时长都超过了70...先看下先行性指标的定义,先行性指标是指新用户在使用产品早期的一种产品行为,这个指标与用户的留存率指标之间存在着非常高的线性相关关系,可以预测用户是否会在产品中留存下来。...案例 拿之前的论坛社交App为假设,假设“用户在注册前10天内添加好友超过7个”为先行性指标,那么我们计算一组数据: 其中,用户前10天内添加好友超过7个,则其30日留存下来可能性为99%;若添加好友小于

    46920
    领券