1 - 零售超市数据分析(趋势和指标)
01
前言
一不小心快半年没更新了,谢谢读者们的不离不弃。
以前的 “原理+代码” 系列,侧重的是以通俗易懂的方式来讲解一个模型/算法(比如随机森林,不平衡采样),然后再配上注释详细的代码,方便读者学习基本原理和代码实现,最终实现快速上手并为深入学习打下一些基础。
而这篇文章,将开启 “思路比代码重要” 这个新系列,目的是让读者们意识到,很多时候只了解算法模型和捣鼓代码是远远不够的。
本文的主要分为两个部分:
本文数据代码可以在后台回复「零售超市」获取
02
商业案例
问:拿到这份数据和它的指标解释,15分钟内能不能给出一个初步的分析结果和结论?
请读者至少先思考个5分钟再继续往下看
答:我只知道 2010~2018 年,数据中各项指标的数值都在不断变大,看起来这家公司经营得很不错。
老板:没了?这些我早就知道了。
这里便要开始引入我们的分析思路了(当然上述回答是最低端的)
增长率代表了趋势到底是向好、向坏还是持平。
根据增长率曲线还可以延伸出其他指标:极值点、持续时间,波动幅度等。这里我们选用净销售额同比增长率曲线来作为示例。
同比简介和其计算公式为如下:
同比一般情景下是今年第n月与去年第n月比,如:本期2月比去年2月
同比增长速度=(本期发展水平-去年同期水平)去年发展水平×100%。
这里的数据处理可视化都是用 Python 来完成,但代码都先不展示了,希望把着重点放在对分析思路的理解上。
这里我们同时画出净销售额及其同比增长率两条曲线。我们能看到,尽管销售额一直在增长,但其实并不如我们想象得那么好,增长率在前五年一直下跌且跌幅较大。2016年跌入谷底后,便开始反弹,第一年反弹比较迅速。这里面一定有一些故事值得我们去探索。(提示:2010~2015年,电商井喷式爆发,给很多传统零售企业带来了不小的冲击)
问:为什么选用净销售额而不选取其他指标?
答:因为这只是为了叙述 “看增长率” 这个方法。至于为什么选用这个指标而不用其他的,以及背后的业务知识,之后的文章会提及。这里只要了解 “看增长率” 这个方法就行。
同理,我们也可以同时画出两条增长率曲线。这里选用商品毛利和运营费用的同比增长率,发现尽管商品毛利同比增长率在前五年均有下跌。但还是比同样在下跌的运营费用同比增长率要好,这也说明了一些问题。
比例通常代表了结构,它可以让我们看到重点和变化趋势。
1、自行探索的比例:
很多零售超市都有会员制度,既然刚刚我们发现净销售额同比增长率在前五年都呈下跌趋势,那是不是会员费收入情况也如此呢?
这里我们选择查看每年会员费收入占比净销售额,发现好像每年的会员费收入只是占我们所有收入的很小一部分。或许这个就是正常的百货公司?绝大部分收入都靠实体销售收入所得,所以我们只管卖货挣钱就行?
2、指标放在一起看:
当我们把这两两指标放在一起看后,我们发现:
3、自带标准的比例:
有些比例本来就自带标准,即根据业务知识和常识我们都知道怎样是好/坏的:
我们发现,运营费用比例(成本率)和商品毛利率几乎没有波动(10%与11%),公司经营能力看着很不错?毕竟这么多年来,物价房价早已飞涨。
投入产出比=1投入对应N产出(产出/投入)
我们希望投入产出比保持在一定水平,至少不持续下降,越高越好。
回看数据,运营费用可以作为投入项,至于产出项,到底该用毛利、净销售额还是净利润,这一点可以看具体业务和实际要求,这里我们只为学习分析方法。
所以我们选用了毛利/运营费用作为投入产出比,发现投入产出比略有提高(105%~109%),整体上没啥波动。说明这个企业的持续经营能力强。
03
数据+标准=结论
仅有数据分析的过程和一些结果可视化的图片并不足以说明问题,只有辅以明确的标准,才能得出相对可靠的结论。
最后再小结本文提到的方法,其实分析思路没有高低级之分,哪怕在简单的方法其实也有深入分析的空间。空有代码能力而忽略了对业务背景的(深入)探究,也只会心有余而力不足。我们下期见~