首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >初学者:离散度的标准差怎么解?

初学者:离散度的标准差怎么解?

作者头像
herain
发布2022-04-27 17:50:30
发布2022-04-27 17:50:30
1.4K0
举报
文章被收录于专栏:数据指象数据指象

付费咨询:您好,初学统计学的新人。

请问通常来说,会采用标准差还是变异系数来代表离差呢?

能否以图中的这个数据来解释呢?

思考很久,虽是新人问,但是好问题。

深夜回应:感谢收到你的咨询,看了多遍的陈述。

题主多半是想问:用标准差还是变异系数来度量两组或多组数据的离散程度吧?

从统计描述角度去分析一组数据主要分析两个方面:

一是 集中程度,反映一组数据的普遍性,通常采用的统计量有平均数、中序数、中位数、众数等;

二是 离散程度,反映一组数据的特殊性,通常采用的统计量有离差和、离差平方和、平均差、极差、分位数、标准差、方差、变异系数等;

接下来,回归正题,如何更好的度量两组或多组的数据离算程度呢?

首先纠正一下,离差是一个观测值或样本的点与期望值的差值!离差是衡量单一观测值的,不能用于衡量一组数据的计算程度的,但是一组数据的离差和或者离差平方和可以度量离散程度。

由于离差通常是绝对差值,需要考虑正负号,所以用的很少!通常使用标准差和平方差,不用考虑正负符号问题,同时方差可以放大差异值,达到放大镜的效果,简单直观。

到此,我们可以说大多数我们度量两组或多组数据离散程度的时候,采用标准差或平方差就足够了。

为什么会出现 变异系数呢?

存在即合理,为了处理特殊的情况,那就是测量的尺度和量纲有差异的时候;需要用标准差除以均值,来消除尺度和量纲的影响。

比如用厘米和千米度量A,B两组数据,得到的方差都是1,理论上离散度应该是一样的,但是1厘米和1千里直接比较与理论大相径庭。需要消除掉尺度单位的影响,就需要“以己之道还己之身”,各自的方差除以各自的均值即可。同理量纲主要是数据量级带来的影响,变异系数同样能够很好的处理这种情况。

标准差表征的是数据离散的绝对值大小;变异系数则是,也称为“相对标准差”。由于变异系数表征的是数据离散性的相对“百分数”,所以更能准确的判断数据的离散程度。

标准差虽好,但是考虑均值的影响,比如标准差相同,均值差距很大,到底哪一个离散度更高呢?标准差与均值的情况组合有很多种,“仁者见仁,智者见智”,所以需要统一的标准,标准是减少纷争最好的方法之一,这恰如始皇帝“书同文,车同轨”的妙处所在。

因此,当只考虑一组数据内部自己的离散度用标准差就好,但如果多组衡量数据的离散程度,变异系数比标准差更合适。

绝对是真理,相对是公平。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据指象 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档