付费咨询:您好,初学统计学的新人。
请问通常来说,会采用标准差还是变异系数来代表离差呢?
能否以图中的这个数据来解释呢?

思考很久,虽是新人问,但是好问题。
深夜回应:感谢收到你的咨询,看了多遍的陈述。
题主多半是想问:用标准差还是变异系数来度量两组或多组数据的离散程度吧?
从统计描述角度去分析一组数据主要分析两个方面:
一是 集中程度,反映一组数据的普遍性,通常采用的统计量有平均数、中序数、中位数、众数等;
二是 离散程度,反映一组数据的特殊性,通常采用的统计量有离差和、离差平方和、平均差、极差、分位数、标准差、方差、变异系数等;
接下来,回归正题,如何更好的度量两组或多组的数据离算程度呢?
首先纠正一下,离差是一个观测值或样本的点与期望值的差值!离差是衡量单一观测值的,不能用于衡量一组数据的计算程度的,但是一组数据的离差和或者离差平方和可以度量离散程度。
由于离差通常是绝对差值,需要考虑正负号,所以用的很少!通常使用标准差和平方差,不用考虑正负符号问题,同时方差可以放大差异值,达到放大镜的效果,简单直观。
到此,我们可以说大多数我们度量两组或多组数据离散程度的时候,采用标准差或平方差就足够了。
为什么会出现 变异系数呢?
存在即合理,为了处理特殊的情况,那就是测量的尺度和量纲有差异的时候;需要用标准差除以均值,来消除尺度和量纲的影响。
比如用厘米和千米度量A,B两组数据,得到的方差都是1,理论上离散度应该是一样的,但是1厘米和1千里直接比较与理论大相径庭。需要消除掉尺度单位的影响,就需要“以己之道还己之身”,各自的方差除以各自的均值即可。同理量纲主要是数据量级带来的影响,变异系数同样能够很好的处理这种情况。
标准差表征的是数据离散的绝对值大小;变异系数则是,也称为“相对标准差”。由于变异系数表征的是数据离散性的相对“百分数”,所以更能准确的判断数据的离散程度。
标准差虽好,但是考虑均值的影响,比如标准差相同,均值差距很大,到底哪一个离散度更高呢?标准差与均值的情况组合有很多种,“仁者见仁,智者见智”,所以需要统一的标准,标准是减少纷争最好的方法之一,这恰如始皇帝“书同文,车同轨”的妙处所在。
因此,当只考虑一组数据内部自己的离散度用标准差就好,但如果多组衡量数据的离散程度,变异系数比标准差更合适。
绝对是真理,相对是公平。