任何一个研究者,管他是诺贝尔奖获得者,还是第一次写毕业论文的本科生,遇到正态分布的计量资料,第一步就是要算出均数和标准差。因为均数和标准差是描述计量资料的指标,它们形影不离、缺谁都不行。
青果老
小青果
弱弱都问一下,统计学中也有不离不弃的爱情故事吗?
下面看一份调查资料,包含28个调查对象的性别、年龄、地区和甘油三酯等信息。
青果老
【例子】
调查数据录入SPSS,得到如下数据库
在这个数据库中,年龄、甘油三酯属于计量资料,SPSS系统认定为数值型变量;性别、地区属于字符串型变量。一般情形下,数值型变量可以计算均数标准差,字符串型变量用于分组。当然,字符串型变量也可以转换成有序的数值型变量并用于分组。
青果老
小青果
光说不练假把式。具体操作一下,我们好理解。
【操作】
1
单一变量的统计描述
这是用于计算均数标准差的最简单方式,直接将光标移至变量所在的数据上,点击右键,选择“描述统计数据”即可。
青果老
所得结果
2
分组资料的统计描述
小青果
可是,如果想得到类似下面表格的均数±标准差数据,怎么办呢?
步骤
将“甘油三酯”送入"因变量列表"栏中,将“性别”送入"因子列表"栏中
青果老
3
重新分组的统计描述
小青果
你说“字符串型变量也可以转换成有序的数值型变量并用于分组”,说的是下面这张表的模样吗?
年龄是连续型的计量资料,一般不会采用一岁一组,而是习惯上是每5岁分一组。于是必须先建立一个新变量来寄存5岁一组的信息。
青果老
将“年龄”变量送入“数字变量→输出变量”栏中,在右侧的“输出变量”栏中的名称里,输入新变量名称,点击更改,再点击旧值和新值。
青果老
在“旧值”栏中输入旧值的范围,在“新值”栏中输入分组的顺序号,点击添加;依次输入,直至完成分组。这是就会看到数据库中出现一个新变量“年龄分组”,并有相应的数字。
青果老
小青果
然后,再按照上面调用“统计描述”→“探索”命令的方式,就能算出年龄分组的甘油三酯均数和标准差。
4
多级分组的统计描述
小青果
果老,能来点有技术含金量的吗?比如下面表格里的均数标准差。
来就来啊,哥俩好啊,五魁首……搞错了,我是搞统计的,不是搞酒的。
青果老
步骤
将“变量”栏中的“甘油三酯”送入右边的“列”位置,依次将“变量”栏中的“地区”、“性别”送入右边的“行”位置。最后点击左下方的摘要统计量。
青果老
从“统计量”栏中选择需要的统计量,送入“显示”栏中的表中。点击应用选择,再点击确定。
青果老
咋滴,学会了吗?这可是统计的基本功,不会的话,出门都不好意思见人了。
青果老
小青果
信息量有点多。我想静静……
领取专属 10元无门槛券
私享最新 技术干货