梅西百货公司成立于1858年,到1920年在全美奠定了品牌基础,成为知名度较高的公司。1920年后,梅西百货公司收购多家服装家政品牌,有家政女皇、Tommy Hilfiger、Donald Trump衬衫等等,这些自营品牌占据梅西百货公司全部品牌的40%,为梅西百货公司带来一半以上的利润收入。
1990年后至2008年,梅西百货处于衰退期,它的竞争对手J.C潘妮、科尔士百货公司等快速崛起,对梅西公司的发展造成阻碍。2008年后,梅西百货委托经验丰富的Dunnhumby调查公司帮助梅西百货调查消费者心理,并部署一系列大数据战略。这些大数据战略分别是:苹果支付、当日送达、线上购买线下取货。实体店搭配数据、购物APP、图像搜索、手机提供打折信息、RFID技术、智能试衣间、逛街应用、数字出版、桌面搭配。
这些大数据应用从便捷购物、精准购物、本地化购物等多个方面做出了尝试,其中有一些高智能技术,但大部分都是基于数据得出的结论,比如如何将店铺搭配的更合顾客心意或如何找出最受欢迎的促销方式等问题,都需要数据来回答。而预测销量就是这些问题里的一个既基础又重要的问题。
图1
每种产品究竟能卖多少件是零售商们非常关心的一个问题,如果能够提前知道每个地区未来销量的多少,就能够合理的安排库存,进而节约成本。梅西百货公司的网上商城和移动APP能够帮助梅西百货收集每种产品的用户搜索次数,图1是一幅产品搜索次数和销量的线性回归图,在图1中,每个散点都表示一个真实数据,围绕这些散点使用最小二乘法就可以找到离全部散点的距离加起来最小的直线,这就是我们要找的回归直线。
根据图1中的散点分布,可以看到大部分产品的搜索次数都是在1000次以下的,在图的左下角密密麻麻地聚集着较多的数据,它们呈现一种较缓慢的上升趋势。而当搜索次数超过1000次以后,散点变得稀疏起来,同时这部分点的上升趋势似乎有所加快。因此,我们将数据分成了两部分,分别拟合出相应的回归直线。图中箭头所指的点就是这两条回归线交接的地方。
图2
产品的用户搜索次数固然和销量有很大的关系,但顾客评价、库存、服务态度、物流时间等同样也在影响产品销量。图2是一幅关于库存、顾客评价、销量的回归曲面,这三个变量在三维空间中形成了一个光滑的曲面。观察图2,可以发现库存、顾客评价以及销量之间有明显的相关关系,当库存少于40%时,顾客评价和销量都很低;当库存大于80%后,顾客评价和销量都呈线性增长。
顾客评价和库存共同影响了产品销量,只有当库存大于80%且顾客评价好于0.6的时候,产品才有较好的销量。这三者之间的关系可以用一个二元回归方程量化,但影响销量的因素仍然不止这些,除了上文提到的因素外,折扣力度、广告宣传、购物体验等等也在或多或少的影响着销量的高低。所有的这些因素都可以总结到同一个回归方程中。
上面的公式是一个典型的多元回归方程式,所有的回归方程都可以写出这样的形式。在本小节梅西百货的例子中,Y指的是产品销量,a0是方程的常量,在图2.6中,常量就是回归线和Y轴交点距X轴的距离,它用于矫正方程;Xi表示不同的自变量,它们可能是顾客评价、库存、服务态度、物流时间、折扣力度、广告宣传等等变量;ai则是相对应的Xi的系数,ai越大,对于Y而言,Xi越重要。
有了回归方程,梅西百货就可以轻易地预先求出每种产品的未来销量了。这种方程不仅可以用来规划库存和物流,同时也可以帮助梅西百货将销量好的产品放在顾客容易注意到的地方,将销量差的产品打折促销或和其他产品捆绑销售等。根据不同的问题,梅西百货可以写出不同的回归方程,进而从消费者数据中发现不同的知识。
领取专属 10元无门槛券
私享最新 技术干货