前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法工程师该如何提高数据敏感度?

算法工程师该如何提高数据敏感度?

作者头像
石晓文
发布2019-09-17 10:40:04
4070
发布2019-09-17 10:40:04
举报
文章被收录于专栏:小小挖掘机

大家有没有特别羡慕和害怕过这种人,他能一眼看出你做的PPT里面的数据异常,随时能提出一个数据证明你的小结论有问题,然后以一个数据问题迅速推翻你整 个报告的结论,结果就是你做了整整一个月的分析,全毁了,从头再来。

这样的人逻辑性极强且对你的汇报有生杀大权,最重要的是他有极强的数据敏感度。

那么,什么是数据敏感度?

所谓的数据敏感度,其实就是在大脑内建立了数字和业务之间的联系,而优秀的数据敏感度,就是能够一眼看出数据的问题和背后可能的原因。

什么叫一眼看出?

❖ 如果你是游戏行业的,我告诉你这款MMORPG的次留是20%,你能知道我款产品在行业里处于什么样的水准,游戏前期可能存在什么样的问题等;

❖ 如果你是O2O行业的,我告诉你外卖订单量相比于昨天下跌了10%,你能很快判断出问题的影响面和造成订单量下跌的可能原因;

❖ 如果你是电商行业的,我告诉你我这款产品的复购率是40%,你能很快判断出我这款产品大概是什么类型的产品,在行业内是什么样的水准;

做到这程度,就叫优秀的数据敏感度。如何提升数据敏感度呢?

秘籍:熟悉业务

数据敏感度练成的基础是一定要对业务非常熟悉,无数次的推测及验证都是有用的宝贵经验。

接下来我会根据分析师数据敏感度高的三个表现来给出提升数据敏感度的方法。

⒈如何快速判断数据是高了低了还是错了:熟记关键指标的大数、观察趋势、紧盯异常值

这种快速判断是基于平时对业务数据的熟记与使用的,请相信每个人的记忆力有好坏之分,但是只要下功夫,熟记业务的关键指标,了解他们的基本规律,经过一段时间的积累,你看这些数据的时候肯定会觉得胸有成竹。

记忆数据的技巧也是有的,不需要记全,只需要把关键指标的大数记下来,忽略小数,每天早上养成看报表的习惯,观察趋势,盯紧异常数,多看一些别人是怎么分析异常原因的案例。慢慢地,对各项数据有了基本概念之后,理解数据背后的业务逻辑关系,这样在阅读报表时也能很快发现异常值,及时进行追踪。

但是对于想转行的新人,或者说应届生来说,这个时候还没有接触到具体业务的机会,怎么办?

对于新人或面临转行的人来说,这两种类型的人都缺少对本行业的通识,第一件要做的事就是背数据,记住这个行业的行业平均数据和各项通用指标的定义,这么做是为了对整个行业有个总体的认知。

比如游戏行业,可以查询应用宝、360、硬核等各家平台发布的游戏数据,对市面上的各种游戏类型的留存、付费等数据有一个整体的整理和记忆,比如Arppu、Arpu、次日留存、三日留存、七日留存、月留存、付费率等等。

比如电商行业,流量*转化率*客单价*复购率这个公式则是重中之重等等。

⒉知道所有指标是怎么来的,知道它们的意义以及相互的关系,进而判断数据异常的原因

提升敏感度的时刻想着三个问题:

❖ 数据怎么来的?

理解业务,分析溯源,同时也要判断数据来源的可靠性

指标维度有哪些?

理解评估标准,不同业务有不同的关键业务指标,利用思维导图积累相关业务的指标体系,多总结多问为什么;指标体系经常用于数据细分找原因,知道数据构成才能更快地拆分数据,找到异常原因。

数据如何说明业务?

指标在业务中的应用,业务数据正常水平是怎么样的,受节假日或者活动营销的影响的数据又是怎么样的,要多对比,结合环比同比明白数据高低的意义等。

⒊拿到数据,能够根据分析目标很快理出分析框架,得出结论。

假如你是百度外卖的运营负责人,某天移动端的订单量比前一日下降了5%,你的老板要求你对这一变动做出合理解释,你如何应答?

其次先明确指标变动的异常程度和影响面,订单量比前一日下跌5%,是否大到必须加以重视。

以2015年百度外卖B轮融资计划书展示的数据看,其拥有3000万的注册用户,日订单数量超过110万,客单价可达50元左右。以此数据估算,假设2016年底注册用户数达到6000万,日订单数据量突破200万,客单价基本不变,那么5%的订单量下滑意味着当日损失500万营收。天然的单一突发事件几乎不可能造成这么大的损失,因此足以引起团队的重视(这里只是以融资计划书的付费数据为例,实际上作为运营负责人,这些数据都是内部可直接获取的)。

确定需要引起重视后,就需要寻求数据分析的角度,排查异常原因,我们以游戏行业为例,分析影响数据异常变动的原因可能有哪些,这里的思考模式其实就是金字塔结构思维模式

先考虑全局指标:包括一定时间内新增用户量、总体付费率、总留存率、用户活跃度、各环节总转化率、搜索功能使用率、翻页率、崩溃率等。全局指标用于分析对全体用户产生影响的共性原因,绝大部分问题都会在全局指标上体现出来;

再看分渠道指标:可以按不同用户属性(新老用户)、用户来源(下载渠道)、用户自然属性(地域、性别)网络环境(网络运营商、网络接入方式)等维度观察不同渠道数据是否存在异常。

在上述两项指标基础上,再考虑用户行为数据:重点观测用户在不同时间段、不同需求类型下的行为,从而定位到由于某一细分人群的定向变化产生的数据异常;

时间因素:外界环境的影响也可能对产品数据造成影响,因此观测环比和同比数据都很重要。

典型如“月末效应”,即一定规模的用户群体因月底流量耗尽而减少上网行为,造成整体流量的下滑。另外,对于一款外卖产品而言。天气变化也会造成数据波动,通常阴雨天气的订单量会走高。

同样的,“周一效应”“寒暑假效应”也是游戏行业比较常见的效应,游戏dau在周一往往会走低,在寒暑假往往会走高;

其他产品线监控:百度集团旗下的其他产品线变动也可能成为造成订单量下滑的原因,例如91应用市场改变了App广告的展示位置,或是搜索引擎的算法调整降低了网民常用关键词的权重等(通过下载来源的分渠道数据可以明显看到哪个下载来源的数据有减少);

舆情监控:包括但不限于通过人工或机器方式,从内部反馈渠道如客服系统到论坛、贴吧、微博、朋友圈等处采集大众对产品的实时意见。极有可能因此发现导致产品数据骤然降低或飙升的特殊舆情,如竞争对手有了哪些动作、母公司运作重大纰漏等;

定位到具体的问题和原因后,给出对应的结论和解决方案,比如修复某个bug,针对竞争对手的营销策略做出同等力度的折扣反击等。

分析出问题原因只是第一步,提出解决问题的方案才是最关键的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小小挖掘机 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 BI
腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档