事情是这样的,考试周又来了,无聊的我复习着“医药数理统计方法”就刷起了手机。然后,我发现有点好玩诶。这么多人都抽奖结果觉得不可能呢,然后我在西区5楼,哐当拿起笔,算了一下。结果我算错了,以为有可能,愤而回宿舍,写着这篇文章发现自己算错了。很难受,还是决定发出来QAQ
太长,大致类似于这么个思路(图来源于传说中的QQ空间)
这些都是估算,我们来看看实际数据。
实际情况是这样的。
这样吧,我们大概假设参与抽奖人数约等于转发人数,2200万好了,方便计算。
男女比多少呢?根据新浪总裁的说法,1:1.2。
好,我们进入正题。
数据:男性参与抽奖人数1000万,女性参与抽奖人数1200万,男性中奖人数1人,女性中奖人数112人。
由于上面的图都是卡方检验,那我们先进行一波非参数假设检验。
(非参数检验方法不能充分利用样本信息,如果用于那些适用于参数检验的问题,则会降低检验效能。from 高祖新《医药数理统计方法》)
方法一:总体率比较的列联表卡方检验
表1 男女中奖结果
首先,建立假设检验
H0:男女用户总体中奖率相等,P1=P2。
H1:女用户的总体中奖率高于男性,P1>P2。
计算理论频数:
同理得到:
用卡方简化公式计算(n>40,E>5)
算出卡方=90.54。
查表,对α=0.05,卡方理论值=3.841(df=1)。
故拒绝H0。
方法二:参数检验方法
中奖率近似服从正态分布N(P,P(1-P)/n)
H0:P1=P2 H1:P1>P2
取两个样本率p1和p2的加权均值作为总体中奖率 P=113/22000000=0.00051
u=9.52>1.64
故拒绝H0。
认为男女用户中奖率有显著性差异。
只计算,不评论,再见,我真傻,真的。
领取专属 10元无门槛券
私享最新 技术干货