原创内容
No.686
方法 | 数据下降怎么办
上一篇文章留了一个小问题,数据下降怎么办?
图片由海艺AI绘制
上一篇文章的结尾,我留了一个小的问题,数据出现这种形式的走势又该怎么分析:
数据一开始是缓慢下降的,后来有一个大幅度的提升,接下来就是直线下滑的趋势,是不是让人看起来有点发慌?大家可以花五分钟时间思考一下遇到这种情况又该如何下手。
这个情况其实是我真实遇到过的一个业务场景,这里是生成了一些假数据仿造曾经遇到的真实业务场景做得图像。首先说明一下,陡坡式的增长实际上来自于业务策略的调整。
首先,当业务策略调整时出现一个急转直上的调整是非常正常的,毕竟指标如果没有大幅度的调整我上新策略图啥嘛。
起初,大家可能不觉得这个问题有什么异常:
但是随着下降天数的增加,这个问题就让人越发心里发毛了,到底发生了什么事情会导致数据出现持续性地下滑。
出现了这种情况的数据,我们很自然的一个反应是要去分析数据策略前后的差异。通过第一个图其实不难看出,在策略调整前和策略调整后,数据都是处于下滑的,但是策略调整后下滑的幅度比策略调整前的下滑幅度变大了。所以这里要做的第一件事就是排查新上线的策略是不是有什么漏洞。
第二步,要去排查下降的主要原因:究竟是什么因素引起了数据的持续下降。这里就是很简单的主要原因分析的思路。看分类,是不是所有的类别的数据都在下降,哪个类别下降多哪个类别下降少,看看是不是有哪个主要类别的下降引起了整体的下降,如果有,就可以拿这个类别的下降去反查第一步的下降是怎么回事。
当前面两步都无法找到问题的时候,比如说穷举了各种分类之后发现数据都是呈现下降趋势,并没有占比过高的特殊值影响,这种时候,就可以考虑放弃就数论数的分析方法了,要开始考虑用一些实验的手段进行分析。
实验分析说起来简单,但是实际实操的时候代价往往是比较大的,对于很多商业场景来说,这里所谓的实验其实不可能做的。
简单来说就是策略归零。既然我们认为数的异常波动和策略的上线有关系,那么我们可以模拟计算一下在老的策略下数据呈现什么样的规律,如果老的策略下数据并不呈现这样的趋势,那么我们就可以认为是策略的问题,归滚策略的版本解决问题。
商业分析和统计分析、学术研究最大的区别就在于,在商业场景下,很多问题都是不可能做实验的。除非业务本身就非常特殊。
一开始讲了这是我真实遇到过的一个案例,所以这里就不卖关子了,这就是一个非常特殊的业务场景,一个可以被实验的业务场景:
对于这么一个业务场景来说,策略的变动其实就是换了一个图像识别的算法,也就是说我们可以用老版本的算法再去跑一次数据看看图像的合格率是什么样的。
然而结果十分遗憾,用了老的算法去跑一遍审核之后,我们发现数据依然是呈现了逐日下降的趋势,至此实验分析法也以失败告终。
做数据分析切忌就数论数。当统计分析法解释不了数据差异的时候就要及时变更策略,不要在数据的海洋中忘我。
数据分析这份工作做久了之后,我们总是会习惯性沉迷于数据带给我们的安全感,却容易忽略最朴素的分析方法,那就是原理分析。
大家都知道数据分析师入门容易,但是成为一个卓越的数据分析师却非常难。卓越分析师的难度之一就是原理分析。做原理分析其实需要数据分析师有非常强大的知识储备和学习能力,能够快速看到事物的本质和不同事物之间的联系,进而做出判断。而这种能力,或许才是AI无法取代的真正的核心竞争力。
数据是对真实世界的一个侧面的反应,但不是真实世界的完全映射。我们能从数据中分析出的结论,终究只是真理的一小部分。
这个案例中,通过对原理的分析,我找到了背后真实的因素:季节。但是我无法通过手头有的数据给到证明,因为我没有去年同期的数据作为参考,数据量也达不到可以拿来做周期分析的量级,剩下能做的事情就只有静静等待数据验证我的结论。
原理其实很简单,数据的持续下降的根本原因是太阳高度角在一天天变小。也就是说,这个数据还会一直下降,直到太阳高度角回升的那一天。
接下来就是讲故事的环节了。后来我在分析会上非常坚定地告诉大家数据还会持续下降,季节因素引起的下降,数据会一直下降到冬至日才能有所提升。起初团队的很多成员都不相信,始终认为我的分析并不正确,直到后来冬至后指标出现了V字大转折才终于让团队的所有成员都信服。自此以后,再也没有人质疑过我给出的数据和分析结论了。
讲这个故事其实就是想告诉大家,数据分析并不是只和数据打交道,千万不能把眼光局限在数据库的那些数据上。
对数据分析师而言,持续学习是十分重要的,从来就没有什么知识是无用的知识,它们有可能在一些你意想不到的地方发挥重要的作用。
对于如何有效扩宽知识面的问题,感兴趣的朋友们可以点一下在看或者留言,如果感兴趣的人比较多,后续专门出一期。
二号姬
半路出家自学成才的文科数据人,看过了大厂的风景也做过了小厂的CDO~目前是闲职,写写稿带带学生,欢迎勾搭~
更多干货,尽情关注