Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据分析小案例(二):面包是不是变轻了(python)

数据分析小案例(二):面包是不是变轻了(python)

作者头像
三猫
发布于 2018-04-10 03:30:23
发布于 2018-04-10 03:30:23
1K00
代码可运行
举报
运行总次数:0
代码可运行

案件回顾

面包是不是变轻了

  1. 面包店对外声称每个面包分量为400g
  2. 老店主退休,儿子接管面包店
  3. 有顾客投诉,面包分量比以前的轻了
  4. 统计了30个面包的重量,发现面包平均重量为397g(问题:手工面包不可能每个正好400g,根据数据判断,面包的分量到底有没有变轻?)
  • 模拟实验与分析

数据存储为csv格式,其中每个观测对象(各个面包)占一行,测定的变量(购买日期和面包重量)排成一列。将数据导入python。

import pandas as pd breads = pd.read_csv('breads.csv',encoding='utf-8') breads.head()

pandas包提供了dataframe数据结构,在python中用pandas可以非常方便的导入csv数据。使用head()查看前几行数据(默认为前5行)如下:

date

weight

0

2015/1/7

386.7

1

2015/1/9

396.7

2

2015/1/10

409.8

3

2015/1/12

384.5

4

2015/1/14

394.3

计算面包重量的均值和标准差:

import numpy as np mean = round(np.mean(breads.weight),4) std = round(np.std(breads.weight),4) import sys sys.stdout.write('mean = ' + str(mean) + '\n' + 'std = ' + str(std))

结果为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mean = 397.1267
std = 10.7371

假设面包的重量符合正态分布,那么检验面包是否变轻,就要用样本的标准差来检查样本平均值和总体平均值之间是否存在矛盾,即均值差异检验。

均值差异检验(t检验)

  1. 零假设 样本均值与总体均值的差异在误差范围内,即面包没有变轻
  2. 备择假设 样本均值与总体均值的差异超出了误差范围,即面包变轻
  3. 概率不足显著性水平(5%) 否定零假设,即面包确实变轻了
  4. 概率等于或超过显著性水平(5%) 保留零假设,即面包重量没有改变

代码语言:javascript
代码运行次数:0
运行
复制

from scipy.stats import ttest_rel #ttest_rel:非独立均值检验 ttest_rel(breads.weight,[400]*30)

代码语言:javascript
代码运行次数:0
运行
复制

结果为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Ttest_relResult(statistic=-1.4411172599973978, pvalue=0.16026297018603147)

pvalue代表概率,这里面概率为0.1603,概率超过显著性水平,因此,没有足够证据怀疑面包房的面包平均重量减少

  • 几个小概念

正态分布:以平均值为中心左右对称离散的分布。有95%的数据集中在距离平均值1.96倍(约2倍)标准差的范围内。

均值差异检验:本例中指分析了30个面包的平均重量与面包店宣传的平均重量之间是否存在实质性差异。如果概率小于显著性水平(一般为5%),则认为存在显著差异。


机器学习养成记

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习养成记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
excel数据分析工具库系列四|假设检验
今天要跟大家分享的是excel数据分析工具库系列四——假设检验! 一共会讲到关于假设检验的5个知识点: Z-检验:双样本均值差检验 T-检验:平均值的成对二样本检验 T-检验:双样本等方差假设 T-检
数据小磨坊
2018/04/10
4K0
excel数据分析工具库系列四|假设检验
数学建模---t检验样例和matlab代码
下面的三个题目分别对应上面的三个类型,可以简单的实践一下:因为之前的这个理论并不有利于我们的理解,在一个真实的案例里面,我们可以更加清楚的知道这个参数的具体含义,以及我们的这个检验方法的适用场景
阑梦清川
2025/02/24
1640
数学建模---t检验样例和matlab代码
数据分析:两组数据的T检验power评估
百度网盘链接: https://pan.baidu.com/s/1NE-jYGWY9snI7j8NkJS-8A
生信学习者
2024/08/01
1710
Java开发者的Python快速进修指南:掌握T检验
T检验是一种用于比较两个独立样本均值差异的统计方法。它通过计算T值和P值来判断样本之间是否存在显著性差异。通常情况下,我们会有两组数据,例如一组实验组和一组对照组。
努力的小雨
2024/03/05
4660
数据分析师必备的基本统计学知识
数据分析师,无疑是数据时代最耀眼的职业之一,统计学,又是数据分析师必备的基础知识。
1480
2019/07/15
1.3K0
数据分析师必备的基本统计学知识
没有最好,只有A/B测试!
“A/B测试不一定是最好的评估方法。它不是万能的,但不会A/B测试肯定是不行的。”
阿泽 Crz
2021/07/06
1.7K0
没有最好,只有A/B测试!
Python统计分析
描述性统计偏度和峰度累计值假设检验和区间估计示例1假设检验置信区间示例2假设检验置信区间
用户3577892
2020/07/14
9540
Python统计分析
python scipy.stats计算单样本假设检验(1 sample test)
单样本检验:检验单个变量的均值与目标值之间是否存在差异,如果总体均值已知,样本均值与总体均值之间差异的显著性检验属于单样本假设检验。
小末快跑
2020/08/13
2.4K0
概率分析方法与推断统计(来自我写的python书)
在数据分析统计的场景里,常用的方法除了描述性统计方法外,还有推断统计方法,如果再从工作性质上来划分,推断统计包含了参数估计和假设验证这两方面的内容。而推断统计用到了很多概率统计方法,所以本小节在介绍推断统计的内容前,还将讲述一些常用的概率统计方法。
用户1153489
2021/03/02
8450
概率分析方法与推断统计(来自我写的python书)
如何检测两组数据是否同分布?
一个模型中,很重要的技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设,但很多时候我们默认这个道理,却很难有方法来保证数据同分布。
Python数据科学
2021/10/08
2.5K0
t检验的工作原理和在Python中的实现
因此,总有一天你可能会使用t检验,深入了解它的工作原理非常重要。作为开发人员,通过从头开始实现假设检验以理解。
AiTechYun
2018/08/16
9.2K0
t检验的工作原理和在Python中的实现
独家|使用Python进行机器学习的假设检验(附链接&代码)
也许所有机器学习的初学者,或者中级水平的学生,或者统计专业的学生,都听说过这个术语,假设检验。
数据派THU
2019/08/30
1.1K0
独家|使用Python进行机器学习的假设检验(附链接&代码)
假设检验在数据分析中的应用
在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉大部分初学者假设检验怎么在数据挖掘中使用。
用户3577892
2020/10/09
1.3K0
假设检验在数据分析中的应用
Python数据科学:正态分布与t检验
区间估计用到了中心极限定理,表现为如果抽样多次,每次抽样都有一个均值,产生的多个均值服从正态分布。
小F
2020/10/09
2.2K0
Python数据科学:正态分布与t检验
常用统计检验的Python实现
今天给大家整理了一些使用python进行常用统计检验的命令与说明,请注意,本文仅介绍如何使用python进行不同的统计检验,对于文中涉及的假设检验、统计量、p值、非参数检验、iid等统计学相关的专业名词以及检验背后的统计学意义不做讲解,因此读者应该具有一定统计学基础。
刘早起
2020/04/22
2.4K0
python数据分析——在数据分析中有关概率论的知识
参数和统计量在数据分析中起着至关重要的作用。参数是对总体特征的描述,如均值、方差等,而统计量则是基于样本数据计算得出的,用于估计或推断总体参数的值。
鲜于言悠
2024/03/20
2990
python数据分析——在数据分析中有关概率论的知识
数据分析必备——统计学入门基础知识
导读:要做好数据分析,除了自身技术硬以及数据思维灵活外,还得学会必备的统计学基础知识!因此,统计学是数据分析必须掌握的基础知识,即通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域,而在数据量极大的互联网领域也不例外,因此扎实的统计学基础是一个优秀的数据人必备的技能。
数据社
2020/10/09
1.7K0
数据分析必备——统计学入门基础知识
利用python进行T检验
注:ttest_1samp, ttest_ind, ttest_rel均进行双侧检验 H0:μ=μ0H_0: μ=μ_0 H1:μ≠μ0H_1: μ≠μ_0
py3study
2020/01/13
2.5K0
数据分析:假设检验方法汇总及R代码实现
显著性检验方法,通常也被称为假设检验方法,是统计学中用于评估样本统计量是否显著不同于某个假设值的一种重要工具。以下是假设检验方法使用时需要考虑的三个条件的书面化表述:
生信学习者
2024/06/20
8540
数据分析:假设检验方法汇总及R代码实现
统计学基础:Python数据分析中的重要概念
统计学是一门研究数据收集、分析和解释的学科,它在数据分析中起着重要的作用。Python作为一种功能强大的编程语言,在数据分析领域拥有广泛的应用。本文将介绍Python数据分析中的重要统计学概念,帮助您更好地理解和应用统计学知识。
网络技术联盟站
2023/07/03
6660
统计学基础:Python数据分析中的重要概念
相关推荐
excel数据分析工具库系列四|假设检验
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验