作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。
知乎:
https://www.zhihu.com/people/parkson-19/posts
前言
卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。
1.适用条件
1)每组的理论次数都要大于5;
2)应用卡方测验的次数资料不应是测量的观察值或以百分数表示的相对数。
2.分类
1)检验样本方差的齐性;
2)适合性检验,比较观测值与理论值是否符合(孟德尔遗传定律);
3)独立性检验,比较两个或两个以上的因子相互之前是独立的还是互相影响的。
3.R实例
代码部分只体现卡方独立性检验
R语言中实现卡方检验的函数是chisq.test(data),data以列联表的形式展现。
备注
1)卡方检验的结果,值是越大越好,还是越小越好?
答:与其它检验一样,所计算出的统计量越大,在分布中越接近分布的尾端,所对应的概率值越小。如果试验设计合理、数据正确,显著或不显著都是客观反映。没有什么好与不好。
参考
T检验与F检验的区别_f检验和t检验的关系 - Little_Rookie - 博客园
https://www.cnblogs.com/nxld/p/6185433.html
回复爬虫爬虫三大案例实战
回复Python1小时破冰入门
回复数据挖掘R语言入门及数据挖掘
回复人工智能三个月入门人工智能
回复数据分析师数据分析师成长之路
回复机器学习机器学习的商业应用
回复数据科学数据科学实战
回复常用算法常用数据挖掘算法
给我【好看】
你也越好看!
领取专属 10元无门槛券
私享最新 技术干货