首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从零搭建精准运营系统

2018刚过去,趁着春节放假对过去一年主导开发的项目做个梳理和总结 项目背景 平台运营到一定阶段,一定会累积大批量的用户数据,这些用户数据是运营人员的黄金财产。...业务场景 先看几个具有代表性的需求 用户可用额度在20000~50000元,而且有借款记录,未还本金为0,性别为“男” 用户发生了A行为且未还本金大于5000 用户在1天内发生A行为次数大于等于3次 用户在...A行为前24小时内未发生B行为 用户在A行为后一个月内未发生B行为 业务上有两种消息类型 日常消息:由业务人员通过条件筛选锁定用户群,定时或即时给批量用户发送消息或者优惠券 触达消息:主要由用户自身的行为触发...,比如登陆、进件申请、还款等,满足一定筛选条件实时给用户发送消息或优惠券 对于用户筛选条件,也主要有两种类型 用户状态:包括用户自身属性如性别、年龄、学历、收入等,还有用户相关联实体如进件订单、账户信息...以内存实现时间窗功能,无法支持较长跨度的时间窗。 无法有效支持定时触达(如用户在浏览发生一段时间后触达条件判断)。

1.8K31

从贝叶斯定理到概率分布:综述概率论基本定义

条件概率 通常,我们想知道某些事件发生时其它事件也发生的概率。我们将事件 B 发生时事件 A 也发生的条件概率写为 P(A | B)。以下雨为例: 打雷时下雨的概率有多大? 晴天时下雨的概率有多大?...泊松分布 如果你在一个呼叫中心工作,一天内会接到多少次呼叫呢?多少次都可能!在呼叫中心一天能接到多少次呼叫可以用泊松分布建模。这里有几个例子: 1. 一天内医院接到的紧急呼叫次数; 2....一天内地方接到的偷窃事件报告次数; 3. 一小时内光顾沙龙的人数; 4. 一个特定城市里报告的自杀人数; 5. 书的每一页的印刷错误次数。 现在你可以按相同的方式构造很多其它的例子。...泊松分布适用于事件发生的时间和地点随机分布的情况,其中我们只对事件的发生次数感兴趣。泊松分布的主要特点为如下: 1. 任何一个成功事件不能影响其它的成功事件; 2....泊松分布和二项分布的关系 以下条件下,泊松分布是二项分布的极限形式: 1. 试验次数非常大或者趋近无穷,即 n → ∞; 2.

1.1K90
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    从贝叶斯定理到概率分布:综述概率论基本定义

    条件概率 通常,我们想知道某些事件发生时其它事件也发生的概率。我们将事件 B 发生时事件 A 也发生的条件概率写为 P(A | B)。以下雨为例: 打雷时下雨的概率有多大? 晴天时下雨的概率有多大?...泊松分布 如果你在一个呼叫中心工作,一天内会接到多少次呼叫呢?多少次都可能!在呼叫中心一天能接到多少次呼叫可以用泊松分布建模。这里有几个例子: 1. 一天内医院接到的紧急呼叫次数; 2....一天内地方接到的偷窃事件报告次数; 3. 一小时内光顾沙龙的人数; 4. 一个特定城市里报告的自杀人数; 5. 书的每一页的印刷错误次数。 现在你可以按相同的方式构造很多其它的例子。...泊松分布适用于事件发生的时间和地点随机分布的情况,其中我们只对事件的发生次数感兴趣。泊松分布的主要特点为如下: 1. 任何一个成功事件不能影响其它的成功事件; 2....二项分布每次试验都是互相独立的,每一次试验都可以看作一个伯努利分布。 泊松分布和二项分布的关系 以下条件下,泊松分布是二项分布的极限形式: 1. 试验次数非常大或者趋近无穷,即 n → ∞; 2.

    85380

    从贝叶斯定理到概率分布的全面梳理!

    当我们研究真实世界的过程时,我们想了解许多影响实验结果的随机事件。不确定性无处不在,我们必须驯服它以满足我们的需要。只有如此,概率论和统计学才会发挥作用。...条件概率 通常,我们想知道某些事件发生时其它事件也发生的概率。我们将事件 B 发生时事件 A 也发生的条件概率写为 P(A | B)。以下雨为例: 打雷时下雨的概率有多大?...泊松分布 如果你在一个呼叫中心工作,一天内会接到多少次呼叫呢?多少次都可能!在呼叫中心一天能接到多少次呼叫可以用泊松分布建模。这里有几个例子: 1. 一天内医院接到的紧急呼叫次数; 2....一天内地方接到的偷窃事件报告次数; 3. 一小时内光顾沙龙的人数; 4. 一个特定城市里报告的自杀人数; 5. 书的每一页的印刷错误次数。 现在你可以按相同的方式构造很多其它的例子。...泊松分布和二项分布的关系 以下条件下,泊松分布是二项分布的极限形式: 1. 试验次数非常大或者趋近无穷,即 n → ∞; 2.

    48620

    Matlab正态分布、历史模拟法、加权移动平均线 EWMA估计风险价值VaR和回测标准普尔指数 S&P500时间序列|附代码数据

    由于 VaR 回溯测试对数据进行追溯,因此“今天”的 VaR 是根据过去_N_  = 250 天(但不包括“今天”)的收益率值计算得出的 。...它不假设资产收益的特定分布。历史模拟通过假设过去的损益可以作为下一个收益期的损益分配来预测风险。“今天”的 VaR 计算为“今天” 之前 最后_N 次_收益率的 _第 p_个分位数 。...其原因是,在极端事件发生之前,量值在几天内不会发生变化。因此,历史模拟方法对波动率的变化反应缓慢。...95% 和 99% VaR 水平至多具有期望失败,其中 N 是观察次数。失败率表明  VaR 水平在范围内,而  VaR 水平不精确并且低估了风险。...该结果表明,在一半的情况下,连续两次失败发生在 5 到 7 天内,比期望的 20 天要频繁得多。因此,会发生更多的测试失败。

    59110

    挖掘用户行为数据最佳武器——SDK

    企业有三类数据: ·企业内部的交易数据 ·企业同用户之间的交互数据 ·第三方数据,或称为外部数据 过去,企业的数据资产大多是建立在交易数据之上的,利用用户属性、销售数据、物流数据、内部流程等数据建立数据资产...很多企业总认为SDK采集数据会涉及个人隐私,这主要还是不了解SDK数据采集的技术原理。 SDK,Software Development Kit,直译过来就是软件开发包,用N行软件代码采集数据。...2、频次 行为数据的频次主要关注某些特定行为发生的次数和趋势,其中次数同用户的兴趣具有较大的正相关度,在一定时间段内,点击浏览次数同用户购买需求成正比。次数经过标签化之后可以用于营销,识别潜在用户。...场景举例: 筛选出有长期理财产品偏好的用户 说明:通过条件设置,在最近30天内搜索并查看长期理财产品分类及详情页大于等于3次的用户筛选出来,定义为有长期理财产品偏好的用户,可以针对这一客群进行潜在用户的二次营销...在完成运营动作后,可自动衡量效果,统计出在执行运营动作后3天内实现“首单投资”的用户数,分析绝对数量/转化率/交易额。

    2K60

    5个等级的数据分析,哪个最深入?

    今天结合一个具体的例子,分享下如何做一个深入的数据分析项目。 深入级别:0级 某天,你收到一个需求:“看下我司APP新增的A功能,过去5天内累计使用1+次的人有多少(去重)”。...确实,当需求是很具体的取数指标+统计时间的时候,这就是取个数,第0级深入就是如此。 深入级别:1级 某天,你又收到一个需求:“看下我司APP新增的A功能,过去5天有多少人在用”。...过去5天内使用过A功能用户基本情况(人数,使用天数分布,使用频次分布) 2.   ...过去5天内使用过A功能用户付费行为(多大比例,付费人群的5天内累计付费金额,5天内付费频次,人均付费金额,人均付费次数) 3.   ...过去5天内未未使用过A功能,且活跃的用户的活跃天数、付费比例,付费金额,付费频次,人均付费金额,人均付费次数) 这样,两个群体一对比,就能出结论了。

    38020

    重复事件(表现形态:活跃、留存、复购)建模(生存分析)的案例学习笔记

    至此,我们可以利用PWP-GT模型顺利找到过去活跃度、使用时长、消费次数等指标的阈值,认为指标大于阈值的用户为高粘性用户。...1.4 cox模型 和 N类留存分类器 虽然使用分类器对留存概率进行建模并运用于实践是一种很流行的方式,但是当目的不仅仅是预测留存概率,且需要对背后的影响因子进行深入分析的时候,采用更合适的统计模型就非常必要了...有序就是指同一对象出现的不同结局之间存在一定的顺序,例如膀胱癌的第二次复发一定是在患者第一次复发以后出现。...换句话说,如果可以合理假设事件复发的风险和过去有无发生、或发生了多少次事件无关,可以使用AG。...为预测每个用户在未来一段时间内的交易次数,这里推导出条件期望, 根据用户历史的交易次数和交易时间数据,并根据上面得到的分布函数参数值,条件期望的最终计算公式如下所示: def calculate_conditional_expectation

    2.8K21

    每个数据科学专家都应该知道的六个概率分布

    这个过程展示了你该如何使用数据分析来尝试解决现实生活中的问题。对于任何一位数据科学家、学生或从业者来说,分布是必须要知道的概念,它为分析和推理统计提供了基础。...现在,呼叫中心一天的呼叫总数可以用泊松分布来建模。这里有一些例子: 1. 医院在一天内录制的紧急电话的数量。 2. 某个地区在一天内报告的失窃的数量。 3. 在一小时内抵达沙龙的客户人数。 4....在特定城市上报的自杀人数。 5. 书中每一页打印错误的数量。 泊松分布适用于在随机时间和空间上发生事件的情况,其中,我们只关注事件发生的次数。 当以下假设有效时,则称为**泊松分布** 1....泊松与二项式分布之间的关系 泊松分布在满足以下条件的情况下是二项式分布的极限情况: 1. 试验次数无限大或n → ∞。 2. 每个试验成功的概率是相同的,无限小的,或p → 0。...3. np = λ,是有限的。 正态分布关系 正态分布是在满足以下条件的情况下二项分布的另一种限制形式: 1. 试验次数无限大,n → ∞。 2. p和q都不是无限小。

    1.3K50

    二项分布、泊松分布和正态分布的区别及联系?

    当统计学家们开始研究概率分布时,他们看到,有几种形状反复出现,于是就研究他们的规律,根据这些规律来解决特定条件下的问题。...只要符合下面3个特点就可以判断某事件是二项分布了: 1)做某件事的次数(也叫试验次数)是固定的,用n表示。...如果你想知道某个时间范围内,发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数,一个月内某机器损坏的次数等 知道这些事情的概率有啥用呢?...,与第2天内中间概率相同) 3)你想知道某个时间范围内,发生某件事情x次的概率是多大 (例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率) 用x代表事情发的次数(例如中奖10个人中奖),u代表给定时间范围内事情发生的平均次数...例如你搞了个促销抽奖活动,只知道1天内中奖的平均个数为5个,你想知道1天内恰巧中奖次数为7的概率是多少? 此时x=7,u=5(区间内发生的平均次数),代入公式求出概率为10.44%。

    63521

    数据科学16 | 统计推断-概率和条件概率

    本章主要学习统计推断常见的概念及相关基础内容。 1. 概率(probability) 概率衡量一个随机事件发生在所有事件的集合里占的比重,是对随机事件发生的可能性的度量。...例:假设一个热线电话在任意一天内接起的电话占这一天内打来的所有电话的比例满足: x <- c(-0.5, 0, 1, 1, 1.5) y <- c(0,0,2,0,0) plot(x, y, lwd...分位数为点 ,满足: 从总体中提取随机变量值小于第95百分位数的概率是95%;从总体中提取随机变量值大于第95百分位数的概率是5%。 任意一天内 或更少的电话被接听的概率是 。...条件概率(又称后验概率):假设 , 事件 在事件 发生的条件下发生的概率表示为 ; 当 和 相互独立时: 。...➢贝叶斯公式Bayes' rule 已知在 条件下 的发生概率,可以计算在 条件下 的发生概率。

    1.1K10

    每个数据科学家都应该知道的六个概率分布

    这个过程展示了你该如何使用数据分析来尝试解决现实生活中的问题。对于任何一位数据科学家、学生或从业者来说,分布是必须要知道的概念,它为分析和推理统计提供了基础。...现在,呼叫中心一天的呼叫总数可以用泊松分布来建模。这里有一些例子: 医院在一天内录制的紧急电话的数量。 某个地区在一天内报告的失窃的数量。 在一小时内抵达沙龙的客户人数。 在特定城市上报的自杀人数。...书中每一页打印错误的数量。 泊松分布适用于在随机时间和空间上发生事件的情况,其中,我们只关注事件发生的次数。 当以下假设有效时,则称为泊松分布: 任何一个成功的事件都不应该影响另一个成功的事件。...泊松与二项式分布之间的关系 泊松分布在满足以下条件的情况下是二项式分布的极限情况: 试验次数无限大或n → ∞。 每个试验成功的概率是相同的,无限小的,或p → 0。 np = λ,是有限的。...正态分布与二项式分布之间的关系,以及正态分布与泊松分布之间的关系 正态分布是在满足以下条件的情况下二项分布的另一种限制形式: 试验次数无限大,n → ∞。 p和q都不是无限小。

    1.9K60

    一日一命令:find 命令详解

    中可用选项非常之多 -mount, -xdev : 只检查和指定目录在同一个文件系统下的文件,避免列出其它文件系统中的文件 -amin n : 在过去 n 分钟内被读取过 -anewer file :...比文件 file 更晚被读取过的文件 -atime n : 在过去n天内被读取过的文件 -cmin n : 在过去 n 分钟内被修改过 -cnewer file :比文件 file 更新的文件 -ctime...n : 在过去n天内被修改过的文件 -empty : 空的文件-gid n or -group name : gid 是 n 或是 group 名称是 name -ipath p, -path p :...find /tmp -gid 1000 // 查找gid是1000的文件 (4)-a and -o and –not的使用 ps:有用 -a 连接两个不同的条件(两个条件必须同时满足)-o 连接两个不同的条件...(两个条件满足其一即可)-not 对条件取反的 find /tmp -name "*.sh" -a -user root find /tmp -not -user root (5)根据文件时间戳的相关属性来查找文件

    42030

    吴恩达团队最新成果:用深度学习来改善临终关怀服务

    预测对象最好为住院病人,前提是他们必须满足上述条件(因为相较于其他类型的病人,住院病人更愿意接受姑息治疗建议) 预测日期必须早于满足上述限制条件的其他所有候选日期。...我们选择的预测日期必须满足以下所有条件: 预测日期必须为记录在案的问诊日期。 预测日期必须至少比最后一次接触病人的日期早 12 个月(以避免发生拍摄 EHR 快照后死亡日期不明确的情况)。...预测对象最好为住院病人(优先于其他类型的病人),前提是他们满足上述限制条件(作为 positive 实例的对照组) 预测日期必须早于满足上述限制条件的其他所有可能候选日期。 图 1....我们将这些编码出现的次数作为一个单独的特征。 我们还考虑了病人的人口统计数据(年龄、性别、种族、民族)以及观察期内各编码类别的汇总数据(如下所示): 类别内特殊编码出现次数。...类别内编码出现的总次数。 在任一天所分配的编码的最大数量。 在任一天所分配的编码的最小数量(非零)。 一天内分配的编码的数量范围。 一天内分配的编码的数量均值。 一天内分配的编码的数量方差。

    1K70

    整理一套互联网行业的数据指标送给你

    平均同时在线人数(ACU: Average concurrent users) 即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。...例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数...(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU) 3. 充值金额(RMB) 即在一定周期内充值总金额。 4....充值金额的和/条件账户数。...流失率 月流失率:30天前登陆过游戏,30天内未登陆游戏的用户数/MAU 周流失率:7天前登陆过游戏,之后7天内未登陆游戏的用户数/WAU 日流失率:统计日登陆过游戏,次日未登陆游戏的用户数/统计日DAU

    1K52

    运营人员必须知道的核心数据详解

    一、运营数据 (1)平均同时在线人数(ACU: Average concurrent users):即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。...[例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数...(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU) (3)充值金额(RMB):即在一定周期内充值总金额。...,充值金额的和/条件账户数。...(14)月流失率:(公式:30天前登陆过游戏,30天内未登陆游戏的用户数/MAU) 周流失率:(公式:7天前登陆过游戏,之后7天内未登陆游戏的用户数/WAU) 日流失率:(公式:统计日登陆过游戏,次日未登陆游戏的用户数

    2.3K40

    软件可靠性度量和分析方法

    故障出现了总要修复,修复后可能再次出现,这个指标对经常重复出现的故障也很有参考意义。MTBF=(周期总时长-故障总时长)/故障次数×100%可理解为这个产品平均每隔一个MTBF就会发生一次故障。...平均故障修复时长(Mean Time To Repair, MTTR)每个故障会有一定的不可用时长,MTTR是统计各级故障的平均不可用时长。...4)系统性故障与偶然性的故障系统性故障:系统性发生的故障,是因为系统架构设计、流程管理、运维体系等造成的,在一定条件下必然发生的故障。...如一天内有100万次请求,其中有100次失败了,那么当日的失败率就是0.01%。...周期失败率=(周期内失败请求次数/周期内总请求次数)×100%按达标时长或不可用时长统计对成功率类的指标设定一个统计周期和基准值,在基准值以下则认为是不可用的。

    11220

    5000字用C++带你入门马氏链。

    马尔科夫链:马尔可夫链简称为马氏链,是马尔可夫过程中离散时间的分支。 马尔科夫链下一个时间为一种状态的概率只和紧邻的上一个状态有关,即将来的状态发生的概率只依赖于现在的状态,跟过去的状态相互独立。...多步转移矩阵一般都是需要根据一步转移矩阵得出的,比如二步转移矩阵就是一步矩阵乘以一步矩阵。以此类推,并且得到的矩阵依然满足上面的性质 为什么要用到多步转移矩阵?...并且因为我们知道了多步转移矩阵从一个状态i到之后的n天之后的状态j,这个的概率跟这n天内状态的改变无关,所以运用多步转移矩阵会方便预测目标发生的概率。...所以是不是多下注就一定不会输掉全部呢??? 欲知后事如何,请听小李分解: 再次输入,这次我们增大赌博的次数,看看第五次全部输掉的概率是多少?...(其他已知的条件当然就不变了) 图五 我。。。这怎么又是0?我们换个次数,上次是5,上上次是4,那么这次来个3。

    83230

    作为运营必须明白的6类数据分析术语

    一.运营数据 1.平均同时在线人数(ACU: Average concurrent users):即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。...[例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数...(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU)。 3.充值金额(RMB):即在一定周期内充值总金额。...,充值金额的和/条件账户数。...14.月流失率:(公式:30天前登陆过游戏,30天内未登陆游戏的用户数/MAU)。 15.周流失率:(公式:7天前登陆过游戏,之后7天内未登陆游戏的用户数/WAU)。

    1.3K30

    大数据预测世界杯 八种方法谁靠谱

    评:百度用的是传统的统计分析,注重近期球队和球员表现,这种预测是至今为止在技术上最稳定的方法,但受意外因素(如天气、伤病、裁判等)影响较大。...为此,分析师要收集来多项数据,包括:世界各个国家足球队历史成绩数据库给出的各队排名得分;比赛中双方球队过去10场和5场比赛的进球数;比赛双方是不是巴西主场;比赛球队是不是美洲球队;还有以往各队在世界杯的进球数优于平时多少个...最后,他们把这几项数据按照一定的权重相加到一起,可以得出每一个球队在对阵另外某一个球队时平均会进多少个球。...、市值、预选赛表现,还包括可能的伤病、战术、气候条件、主场优势因素。...(8)雅虎相信网络流言 雅虎用轻博客网站Tumblr的数据来估计每支国家队的优势,最终计算出最可能获胜的是巴西。雅虎研究小组分析的前提是,Tumblr上所有有关世界杯的讨论都具有一定价值。

    8K70
    领券