初学者：离散度的标准差怎么解？

herain

发布于 2022-04-27 17:50:30

1.4K0

文章被收录于专栏：数据指象数据指象

付费咨询：您好，初学统计学的新人。

请问通常来说，会采用标准差还是变异系数来代表离差呢?

能否以图中的这个数据来解释呢？

思考很久，虽是新人问，但是好问题。

深夜回应：感谢收到你的咨询，看了多遍的陈述。

题主多半是想问：用标准差还是变异系数来度量两组或多组数据的离散程度吧？

从统计描述角度去分析一组数据主要分析两个方面：

一是集中程度，反映一组数据的普遍性，通常采用的统计量有平均数、中序数、中位数、众数等；

二是离散程度，反映一组数据的特殊性，通常采用的统计量有离差和、离差平方和、平均差、极差、分位数、标准差、方差、变异系数等；

接下来，回归正题，如何更好的度量两组或多组的数据离算程度呢？

首先纠正一下，离差是一个观测值或样本的点与期望值的差值！离差是衡量单一观测值的，不能用于衡量一组数据的计算程度的，但是一组数据的离差和或者离差平方和可以度量离散程度。

由于离差通常是绝对差值，需要考虑正负号，所以用的很少！通常使用标准差和平方差，不用考虑正负符号问题，同时方差可以放大差异值，达到放大镜的效果，简单直观。

到此，我们可以说大多数我们度量两组或多组数据离散程度的时候，采用标准差或平方差就足够了。

为什么会出现变异系数呢？

存在即合理，为了处理特殊的情况，那就是测量的尺度和量纲有差异的时候；需要用标准差除以均值，来消除尺度和量纲的影响。

比如用厘米和千米度量A,B两组数据，得到的方差都是1，理论上离散度应该是一样的，但是1厘米和1千里直接比较与理论大相径庭。需要消除掉尺度单位的影响，就需要“以己之道还己之身”，各自的方差除以各自的均值即可。同理量纲主要是数据量级带来的影响，变异系数同样能够很好的处理这种情况。

标准差表征的是数据离散的绝对值大小；变异系数则是，也称为“相对标准差”。由于变异系数表征的是数据离散性的相对“百分数”，所以更能准确的判断数据的离散程度。

标准差虽好，但是考虑均值的影响，比如标准差相同，均值差距很大，到底哪一个离散度更高呢？标准差与均值的情况组合有很多种，“仁者见仁，智者见智”，所以需要统一的标准，标准是减少纷争最好的方法之一，这恰如始皇帝“书同文，车同轨”的妙处所在。

因此，当只考虑一组数据内部自己的离散度用标准差就好，但如果多组衡量数据的离散程度，变异系数比标准差更合适。

绝对是真理，相对是公平。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2020-06-05，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自数据指象微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度