Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >为什么样本方差(sample variance)的分母是n-1?

为什么样本方差(sample variance)的分母是n-1?

作者头像
小小杨
发布于 2021-10-13 02:27:51
发布于 2021-10-13 02:27:51
7630
举报
文章被收录于专栏:下落木下落木

完整的问题描述

如果已知随机变量X的期望为μ,那么可以如下计算方差σ^2:

上面的式子需要知道X的具体分布是什么(在现实应用中往往不知道准确分布),计算起来也比较复杂。

所以实践中常常采样之后,用下面这个S^2来近似σ^2:

其实现实中,往往连X的期望μ也不清楚,只知道样本的均值:

那么可以这么来计算S^2:

那么问题来了,为什么用样本均值X'代替总体均值μ后,分母变成了n-1?

为什么分母是n-1?

定性理解

我们不知道μ是多少的,只能计算出X'。不同的采样对应不同的X':

对于某次采样而言,当μ=X'时,下式取得最小值:

我们也是比较容易从图像中观察出这一点,只要μ偏离X',该值就会增大。

所以可知:

可推出:

进而推出:

可见,如果分母是n,倾向于低估σ^2。

定量分析

其中:

所以:

其中:

所以:

也就是说,低估了σ^2/n,进行一下调整:

因此使用下面这个式子进行估计,得到的就是无偏估计:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 下落木 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
蒙特卡罗(Monte Carlo)方法——从数学原理到实际案例
Monte Carlo方法是一种应用随机数来进行计算机模拟的方法,通过对所研究系统进行随机观察抽样并对样本值进行统计分析,来得到所研究系统的某些参数。
mindtechnist
2025/05/15
1560
蒙特卡罗(Monte Carlo)方法——从数学原理到实际案例
为什么样本方差分母是n-1?
推断统计的核心就是研究如何利用样本去推断总体特征。因为总体的情况一般是未知的,我们又想研究总体的特征,于是我们采用抽样的方法。用样本均值估计总体均值,用样本方差去估计总体方差。
用户8612862
2021/11/18
2K0
为什么样本方差分母是n-1?
数据科学17 | 统计推断-期望方差和常见概率分布
随机变量的分布的中心就是其均值或期望值。均值改变,分布会如同均值向左或向右移动。统计推断中,用样本均值估计总体分布的均值(期望值),样本量越多,样本均值约接近总体均值。
王诗翔呀
2020/07/03
1.7K0
数据科学17 | 统计推断-期望方差和常见概率分布
无偏估计(Unbiased Estimator)「建议收藏」
一个简单的例子(https://www.zhihu.com/question/22983179/answer/23470969):
全栈程序员站长
2022/09/20
8450
无偏估计(Unbiased Estimator)「建议收藏」
一文学习基于蒙特卡罗的强化学习方法
▌4.1 基于蒙特卡罗方法的理论 本章我们学习无模型的强化学习算法。 强化学习算法的精髓之一是解决无模型的马尔科夫决策问题。如图4.1所示,无模型的强化学习算法主要包括蒙特卡罗方法和时间差分方法。本
用户1737318
2018/06/05
2.3K0
统计是推断-样本分布碎碎念
大家知道知道一一个样本是有一个分布的,但是不知道参数。那我们就用已经有的数据来算个数字,就说这个数字是我们想要分布的参数,当然可能不准,这个不准就是要检验。
云深无际
2024/08/21
920
统计是推断-样本分布碎碎念
方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差对比分析[通俗易懂]
本文由博主经过查阅网上资料整理总结后编写,如存在错误或不恰当之处请留言以便更正,内容仅供大家参考学习。
全栈程序员站长
2022/11/11
7.9K0
方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差对比分析[通俗易懂]
详解马氏距离中的协方差矩阵计算(超详细)
2.样本方差 方差(Variance)是度量一组数据的离散(波动)程度。方差是各个样本与样本均值的差的平方和的均值,分母除以n-1是为了满足无偏估计:
全栈程序员站长
2022/09/13
3.4K0
详解马氏距离中的协方差矩阵计算(超详细)
CS229 课程笔记之十七:策略梯度
本节将介绍一种 model-free 的算法,叫做「策略梯度」。该算法不需要像 model-based 的算法一样定义值函数,同时也不需要像 Q-learning 一样定义 Q 函数(Q-learning 也是 model-free 的)。我们将在「有限范围」的假设下介绍策略梯度:定义轨迹
口仆
2020/08/14
3370
无偏估计
无偏估计:估计量的均值等于真实值,即具体每一次估计值可能大于真实值,也可能小于真实值,而不能总是大于或小于真实值(这就产生了系统误差)。
marsggbo
2018/08/10
1.4K0
无偏估计
概率论基础 - 3 - 方差
本文介绍方差。 方差 定义 数学期望(mean)(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。 ——百度百科 对随机变量X,若\mathbb{E}\left[(X-\mathbb{E}[X])^{2}\right]存在,则称它为X的方差,记作 Var[X]。 X的标准差为方差的开平方:\sigma=\sqrt{\operatorname{Var}[X]} 方差度量了随机变量X与期望值偏离的程度,衡量了X取值分散程度
为为为什么
2022/08/05
9090
概率论基础 - 3 - 方差
统计学习导论 Chapter3--Linear Regression
本文介绍了线性回归模型的基本概念、原理、计算方法以及应用。线性回归是一种用于建立自变量和因变量之间线性关系模型的简单而强大的方法。通过最小二乘法,我们可以计算出回归系数,并利用这些系数来预测新的数据点。尽管线性回归存在一些局限性,但在许多实际问题中,它仍然是一个非常有用的预测工具。
用户1148525
2018/01/03
1.1K0
统计学习导论 Chapter3--Linear Regression
方差、标准差、协方差
方差(Variance)是各个数据与平均数之差的平方的平均数,用来度量随机变量与其数学期望之间的偏离程度。
yangzelong
2019/04/09
6.7K0
方差、标准差、协方差
详细解释EM推导过程
1 最大似然概率 例子是说测量校园里面同学的身高分布,分为男生和女生,分别抽取100个人...具体的不细讲了,参考文档中讲得很详细。假设他们的身高是服从高斯分布的。但是这个分布的均值u和方差∂2我们不知道,这两个参数就是我们要估计的。记作θ=[u, ∂]T。 我们独立地按照概率密度p(x|θ)抽取100了个(身高),组成样本集X,我们想通过样本集X来估计出未知参数θ。这里概率密度p(x|θ)我们假设是是高斯分布N(u,∂)的形式,其中的未知参数是θ=[u, ∂]T。抽到的样本集是X={x
机器学习AI算法工程
2018/03/14
1.6K0
详细解释EM推导过程
统计学(2)|AB测试—理论基础
ZZ之前承诺以A/B测试为案例,串联起统计学的理论,让理论直接落地于实践,搭建起统计学理论与工作实践的桥梁。所以,为了实现吹过的牛逼,这篇”A/B测试—理论基础“应运而生。
用户8612862
2021/05/13
1.2K0
统计学(2)|AB测试—理论基础
全网最全总结,有源码!期望、有效值、方差、相关系数、自相关函、互相关函数,还分不清吗?
期望也就是平均值,是一个数值,反应的是随机变量平均取值的情况,期望也叫做加权平均。在信号中代表直流分量。
工程师看海
2022/06/23
1.3K0
全网最全总结,有源码!期望、有效值、方差、相关系数、自相关函、互相关函数,还分不清吗?
方差、协方差、协方差矩阵的概念及意义 的理解
想想大学时候,我们学习数学的目的也就是为了考试,从来没有想过它们能解决什么实际问题。但是现在想想,我们真是错了。数学其实就是来自生活。
锦小年
2019/05/29
4K0
2.1 统计基础
主要用在线性回归的时候来估计b1 unbiasedness: 估计的残差是随机的 efficiency:对比其他估计样本残差最小 consistency:样本增大残差方差降低 linearity:是样本的线形函数
rocket
2018/09/14
1.4K0
2.1 统计基础
概率论三大分布
概率论中的三大分布是卡方分布 (χ²分布)、t分布和F分布。这三种分布都是基于正态分布演变而来的,在统计推断中具有广泛的应用。
用户11315985
2024/10/16
8290
【笔记】《计算机图形学》(14)——采样
本章的用意在于为未来更深一步的光线追踪探索(第23章介绍路径追踪,第24章介绍反射模型)打下数学基础,介绍了计算机中常用的采样和积分理论,且核心是采样方法。内容量适中,字数6.8k。
ZifengHuang
2021/04/13
2K1
推荐阅读
相关推荐
蒙特卡罗(Monte Carlo)方法——从数学原理到实际案例
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档