在之前的推文《试验设计好帮手——Minitab》中,我向大家介绍了Minitab这个好用易学的统计分析软件,其中提到Minitab的图形可视化效果简洁美观。那这篇推文,我将向大家着重介绍Minitab中常见的图表类型。
下图展示的是Minitab中图形菜单中的图表类型,其中一些图表(比如散点图、条形图、饼图等)是老生常谈了,在此不做赘述,本文主要是想着重介绍Minitab中与统计分析结果同时输出的内置图表。
Minitab中很多的统计分析方法都能够输出对应的图表,之所以要学会解读这类图表,一是在于它的独创性和灵活性,二是便于我们更好的解读输出结果,并评估统计假设的有效性。
1、单样本检验中的内置图形
在统计—基础统计中开展单样本检验时,图形选项中通常会有以下选项:直方图、单值图和箱线图(如下图)。
以Minitab中的单样本t检验的内置数据案例数据集“家庭能源成本.MTW”为例,当我们勾选图形中的3种图形后,最终输出的图形如下所示:
直方图
单值图
箱线图
直方图主要用来展示数据在不同区间内的分布情况。从直方图可以看出,“能源成本”的数据分布呈现出中间高两边低的趋势,基本满足正态分布。
单值图展示的是变量数据中每个单值的具体分布情况,以便于我们评估和比较样本分布,查看数据中是否存在异常值。从上图的单值图可以看出,“能源成本”的数据点分布较为松散。
箱线图也是用来展示数据的分布情况的,不同的是,我们可以从该图中查看数据的离散统计量(如图中标识)。从箱线图中可以看出,“能源成本”数据的分布比较分散、均匀。
各图中展示的蓝色线段的中间值表示的是“能源成本”的均值,蓝色线段表示的是均值的置信区间。通过解读这3个图形,我们已经比较直观地了解了数据的大致分布情况,接下来再去理解文本格式的分析结果就更加轻松了。
2、方差分析中的四合一
在统计—方差分析中开展方差分析时,图形选项中通常会选择输出残差四合一检验图(如下图)。
进行方差分析需要满足的基本条件之一是:确定数据的误差是随机的、彼此独立的、且都服从均数为0的正态分布。顾名思义,残差的四合一图形主要就是用来判断残差是否满足均值为0的正态分布。
以Minitab中的单因子方差分析的内置案例数据集“喷漆硬度.MTW”为例,当我们输出四合一后,得到的图形如下所示:
上图在一张图形中显示四个残差图,如果残差满足均值为0的正态分布,这些图形中数据点的分布会呈现出一定规律。左上角的概率图中,数据会比较均匀的分布在红色线条的两侧,不会有偏离太远的数值;在右上角的图形中,数据点会比较对称的分布在中间虚线的两侧;在左下角的直方图中,0点左右两侧的矩形也基本均匀对称;右下角的图关注得较少。
根据上图中的四合一残差图,我们可以基本判断:残差满足均值为0的正态分布。当然,如果想进一步确定,可以输出残差值,对其进行正态性检验。
3、图形化汇总
一般统计分析软件都可以输出数据的描述性统计量,而在Minitab的统计—基础统计中还可以输出图形化汇总。
以Minitab中的图形化汇总的内置示例数据集“开盖转矩.MTW”为例,在变量中选入“转矩”,点击确定,最终输出的图形如下所示:
图形化汇总通过各种统计量(如样本数量、平均值、中位数、标准差)汇总数值数据。上图左侧使用图形描述数据的分布,发现数据的均值大于中位数,直方图的分布呈现出右偏态,不满足正态分布。上图右侧用数值具体描述了数据执行正态性检验的结果、集中趋势统计量、离散程度统计量,以及平均值、标准差和中位数的置信区间。一张图表,一目了然。
根据汇总结果,我们可以进一步判断接下来该对数据集开展何种分析。在“开盖转矩.MTW”案例中,如果我们想分析两种不同机器类型的转矩是否存在显著差异,可以选择双样本t检验。
上述我向大家介绍了Minitab中常见的一些内置图形,了解它们对于后续解读输出的统计分析结果大有裨益,扫除了一些小伙伴在数据分析过程中存在的图表认知障碍。虽然一篇图文不能将所有的图表都一一介绍,但遵循本文中图表的解读方法,其它的图形也能轻松读懂哦。
本文中用到的示例数据均来自Minitab的内置帮助文档,有进一步学习需求的读者可以直接下载练习。
Minitab丰富的图表类型示例(时间序列图等)
领取专属 10元无门槛券
私享最新 技术干货