首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Peason相关

    你开心,所以我开心,这个是不是传说中的相关性呢?

哈哈,不开玩笑了。现在认真地来介绍下相关关系和相关分析的概念。

顾名思义,相关关系就是两个或两个以上的变量之间相互依存的关系,而相关分析也就是针对相关关系的一种分析方法。为了更直观地理解,就用方程的形式呈现。那么就会有:

 y=ax+b  y=a1x1+a2x2+b

y=a1x1+a2x2+······+b

   y=ax2   y=lnx

以上方程的共性:都是研究y与x之间的相关关系;

不同的是:影响y的x可能不止一个。

需要说明的是,相关关系包括了线性相关和非线性相关,比如上面的,都是线性关系,而则是非线性关系。

不过目前来说,分析常见的就是线性相关,也就是描述当一个连续变量发生变化时,另一个连续变量也相应地呈线性变化,一般用Pearson相关系数r来表示。

这里大家要了解一个皮尔逊系数的取值范围,如下表1.1。

注意:相关关系并不等同于因果关系,相关性表示等号两边的变量会同时发生改变,而因果关系,也就是一个因素导致另一个因素发生变化。

好,前面做的铺垫让大家都清楚了为什么要做?那接下来我们就“怎么做”进行实战操作演习。

Step 01: 准备数据,本次选取了某一便利超市近两年的销售数据,其中的变量涉及到年月、所属季度、宣传费用、用户流量以及销售金额等5个。如下图1.1。

图1.1 某便利超市销售数据

PS:在Excel处理上述数据中,从日期中计算所属季度,运用到了公式:TEXT(Lookup(Month())  哦。

Step 02:数据处理和操作,在之前打开的“某便利超市销售数据”界面(图1.1),点击【图形】,选择【旧对话框】,此时右侧弹出子菜单,点击【散点图/点图】,出现如图1.2的窗口,选择【简单散点图】,单击【定义】按钮。

图1.2 散点图/点图 对话框

Step 03:在弹出的窗口【简单散点图】下(见图1.3),将变量“销售金额”移至右侧的Y轴,将变量【宣传费用】移至右侧的X轴中,完成后,单击【确定】按钮。

图1.3 简单散点图

完成以上3个步骤之后,会出现以下输出结果。见图1.4,也就是我们需要的散点图绘制图。

图1.4 散点图绘制

有些人就会问为什么要在相关性分析前制作散点图呢?关于这个问题呢,首先,你们看完这个散点图,有发现什么吗?

对的,发现了横轴上的宣传费用与纵轴上的销售金额呈一定的线性相关性,观察了散点图,这也是进行相关性分析的第一步,帮助我们更直观的观察变量之间的相关性,这就更便于我们去判断了。

   那么这两个变量之间的相关程度到底是多少,高还是低呢?

    这就是我们接下来要说得相关性分析操作了。

Step 04:单击【分析】——【相关】——【双变量】,出现【双变量相关性】对话框。如图1.5所示。

图1.5  【双变量相关性】对话框

Step 05:在对话框“双变量相关性”下,将“宣传费用”、“销售金额”两个变量移至右侧的【变量】框中,由于这2个变量是连续变量,需要保持【相关系数】默认的【皮尔逊】复选框,其他默认的选项也保持不变,点击【确定】按钮,就可得到相关分析的结果。如表1.2。

从上表中,我们就可以清楚地看到“宣传费用”与“销售金额”之间是具有很高的相关性的,皮尔逊相关系数达到0.959,也就是高度正相关,显著性P值也是=0.000 (

 那么,问题来了,你们想不想知道“宣传费用”、“用户流量”和“销售金额”变量之间的关系呢?想知道的话,请亲自动手操作哦,这样印象也更深刻呢。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210208A02LVJ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券