首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python求解中位数、均值、众数

python求解中位数、均值、众数

作者头像
全栈程序员站长
发布于 2022-09-30 12:51:10
发布于 2022-09-30 12:51:10
3.1K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

首先定义一个数据,在这里我假定为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
num=[2,3,2,5,1,0,1,2,9]

一、求中位数

中位数(又称中值,英语:Median),统计学中的专有名词,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,则中位数不唯一,通常取最中间的两个数值的平均数作为中位数。

一个数集中最多有一半的数值小于中位数,也最多有一半的数值大于中位数。如果大于和小于中位数的数值个数均少于一半,那么数集中必有若干值等同于中位数。设连续随机变量X的分布函数为F(X),那么满足条件P(X≤m)=F(m)=1/2的数称为X或分布F的中位数。对于一组有限个数的数据来说,其中位数是这样的一种数:这群数据的一半的数据比它大,而另外一半数据比它小。

计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据算术平均值就是这群数据的中位数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import numpy as np
np.median(num)

二、求均值

平均数(英语:Mean,或称平均值)是统计中的一个重要概念。为集中趋势的最常用测度值,目的是确定一组数据的均衡点。算术平均数(或简称平均数)是一组样本

的和除以样本的数量。其通常记作

例如,

,这组数的算术平均数是:

统计中算术平均数常用于表示统计对象的一般水平,它是描述数据集中程度的一个统计量。我们既可以用它来反映一组数据的一般情况,也可以用它进行不同组数据的比较,以看出组与组之间的差别。用平均数表示一组数据的情况,有直观、简明的特点,所以在日常生活中经常用到,如平均的速度、平均的身高、平均的产量、平均的成绩……“ 范围 ” 用于数值型数据,不能用于分类数据和顺序数据。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import numpy as np
np.mean(num)

三、求众数

众数(mode)指一组数据中出现次数最多的数据值。例如{2,3,3,3}中,出现最多的是3,因此众数是3,众数可能是一个数,但也可能是多个数。在离散概率分布中,众数是指概率质量函数有最大值的数据,也就是最容易取様到的数据。在连续概率分布中,众数是指机率密度函数有最大值的数据,也就是机率密度函数的峰值。在统计学上,众数和平均数中位数类似,都是总体随机变量有关集中趋势的重要资讯。在高斯分布正态分布)中,众数位于峰值,和平均数中位数相同。但若分布是高度偏斜分布,众数可能会和平均数、中位数有很大的差异。

分布中的众数不一定只有一个,若概率质量函数或机率密度函数在x1, x2……等多个点都有最大值,就会有多个众数,最极端的情形是离散型均匀分布,所有的点概率都相同,所有的点都是众数。若机率密度函数有数个局部最大值,一般会将这几个极值都称为众数,此连续机率分布会称为多峰分布(和单峰性相反)。若是对称的单峰分布(例如正态分布),众数和平均数中位数会重合[1]。若一随机变量是由对称的总体中产生,可以用取样的平均值来估计总体的众数。

方法一:用numpy中建立元素出现次数的索引的方法求众数

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import numpy as np
c=np.bincount(num)
np.argmax(c)

方法二:直接利用scipy下stats模块

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from scipy import stats
stats.mode(num)[0][0]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/192453.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年9月17日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
什么是平均数,中位数,众数,方差_平均数标准差
其中,num() 为自定义函数,用于取整,即在不影响数值的情况下,去掉小数点后的 0 以上代码用于添加一组数据。
全栈程序员站长
2022/09/30
7280
什么是平均数,中位数,众数,方差_平均数标准差
你的工资是怎样被平均的?终于有人把平均数、中位数和众数讲明白了
导读:我们在数据处理时,要小心各种陷阱!人们习惯使用统计数据来简化事物描述,但错误的统计方法不仅不能反映事实,还会让数据变得毫无意义。
IT阅读排行榜
2022/06/07
1.3K0
你的工资是怎样被平均的?终于有人把平均数、中位数和众数讲明白了
平均数、中位数和众数及它们之间的关系
平均数(Mean),或均值是统计中的一个重要概念。是集中趋势的最常用测度值,目的是确定一组数据的均衡点。这里的平均数是指算术平均数,即一组数据的和除以这组数据的个数所得的平均值,也叫算术平均值。
全栈程序员站长
2022/09/06
2.3K0
平均数、中位数和众数及它们之间的关系
机器学习数学基础:数理统计与描述性统计
所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。
Datawhale
2020/07/02
1.8K0
机器学习数学基础:数理统计与描述性统计
窦娥:平均数,比我冤枉!
写科普文,写的简明扼要很难,写的妙趣横生也很难,其实难能可贵的读者耐心的阅读及友情转发。
herain
2022/04/27
9450
窦娥:平均数,比我冤枉!
python数据分析——在数据分析中有关概率论的知识
参数和统计量在数据分析中起着至关重要的作用。参数是对总体特征的描述,如均值、方差等,而统计量则是基于样本数据计算得出的,用于估计或推断总体参数的值。
鲜于言悠
2024/03/20
3610
python数据分析——在数据分析中有关概率论的知识
Excel中位数函数MEDIAN使用
语法 MEDIAN(number1,number2,...)  Number1, number2, ... 要计算中值的 1 到 30 个数值。 
红目香薰
2024/07/31
3010
Excel中位数函数MEDIAN使用
数据分析之路—数据的描述性统计
数据的集中趋势描 述是寻找反映事物特征的数据集合的代表值或中心值,这个代表值或中 心值可以很好地反映事物目前所处的位置和发展水平,通过对事物集中 趋势指标的多次测量和比较,还能够说明事物的发展和变化趋势。国家 的人均GDP就是一个集中趋势指标,虽然每个人对国家的GDP贡献度不 一样,但是人均GDP能够代表每个人对国家GDP的平均贡献度,从而反 映一个国家的经济发展水平。
23号杂货铺
2019/09/26
1.4K0
图解数据分析 | 数据分析的数学基础
教程地址:http://www.showmeai.tech/tutorials/33
ShowMeAI
2022/02/25
2K0
图解数据分析 | 数据分析的数学基础
【R系列】概率基础和R语言
R语言是统计语言,概率又是统计的基础,所以可以想到,R语言必然要从底层API上提供完整、方便、易用的概率计算的函数。让R语言帮我们学好概率的基础课。 1. 随机变量 · 什么是随机变量? · 离散型随机变量 · 连续型随机变量 1). 什么是随机变量? 随机变量(random variable)表示随机现象各种结果的实值函数。随机变量是定义在样本空间S上,取值在实数载上的函数,由于它的自变量是随机试验的结果,而随机实验结果的出现具有随机性,因此,随机变量的取值具有一定的随机性。 R程序:生成一个在(0,1,
小莹莹
2018/04/20
2.4K0
【R系列】概率基础和R语言
python求均值、中位数、众数的方法
    其中np.bincount方法返回了一个长度为nums最大值的列表,列表中的每个值代表其索引位数值出现在nums中的次数,例如
py3study
2020/01/08
6.7K0
计算机中位数求和方法总结例题,众数与中位数典型例题「建议收藏」
《众数与中位数典型例题》由会员分享,可在线阅读,更多相关《众数与中位数典型例题(3页珍藏版)》请在人人文库网上搜索。
全栈程序员站长
2022/09/29
3770
机器学习概率基础:除了偏度、峰度还有矩量母函数
本篇介绍随机变量和概率分布的基本概念,以及有关概率分布的一些简单统计量,它们构成了概率和统计的基础知识。
Python数据科学
2021/09/08
1.2K0
机器学习概率基础:除了偏度、峰度还有矩量母函数
Python数据分析之数据探索分析(EDA)
何为EDA,何谓探索性数据分析?英文名为Exploratory Data Analysis,是在你拿到数据集后,并不能预知能从数据集中找到什么,但又需要了解数据的基本情况,为了后续更好地预处理数据、特征工程乃至模型建立。因此探索性数据分析,对了解数据集、了解变量之间对相互关系以及变量与预测值之间的关系尤其重要。
数据STUDIO
2021/06/24
4K0
中位数和众数的定义_众数是什么意思中位数又是什么意思
在初中数学课本中,我们学习了平均数,但是平均数与中位数、众数有是关系呐,下面我就为大家总结一下:
全栈程序员站长
2022/09/30
1.6K0
中位数和众数的定义_众数是什么意思中位数又是什么意思
如何求平均数众数中位数_离散系数
两个例子当中都使用了“平均”这个词,但是实际上有三种不同的方法来测定平均值,而且在大多数情况下,每种方法都会给出不同的数值。
全栈程序员站长
2022/09/30
9810
集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关
计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。 如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。
全栈程序员站长
2022/09/30
1.9K0
集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关
第一周:数据的描述性统计
平静心湖起涟漪,开始新的挑战。我会根据每周工作繁忙程度来完成作业,时间充裕的时候尽量高质量完成,忙的时候采用懒人模式。作业的日期、质量等无法固定,可能会迟到,但不会缺席。
数据处理与分析
2019/07/31
1.1K0
第一周:数据的描述性统计
Java 中位数_中位数众数平均数三者关系
一个长度为N的列表,出现次数大于\left \lfloor N/2 \right \rfloor的数为这个列表的众数。
全栈程序员站长
2022/09/30
1.2K0
Java 中位数_中位数众数平均数三者关系
数据的描述性统计与python实现
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
用户7886150
2020/12/24
8750
推荐阅读
相关推荐
什么是平均数,中位数,众数,方差_平均数标准差
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档