您确定要删除吗?

取消
首页 算法大全 应用模型 分析软件 算法学院数据中心 关于本站
在线咨询
400-820-6981
意见反馈
返回顶部

样本比例检验

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作推断。

假设检验又分为对已知分布的参数检验和对未知分布的非参数检验。参数检验要利用到总体的信息,如总体分布、总体的一些特征和方差;以总体分布和样本信息对总体参数作推断。

参数检验可以分为:以单样本数据的均值推断总体的均值;单样本数据的方差推断总体的方差;以相互独立的双样本数据来推断样本是否来自于同均值或同方差的总体;样本数据的比例检验验证总体数据的比例。

假设检验的基本思想:小概率原理。如果对总体的某种假设是真实的,那么不利于或者不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的,要是在一次试验中A发生了,就有理由怀疑该假设的真实性,拒绝这一假设。

算法描述

样本比例检验主要包含单样本比例检验和双样本比例检验;单样本比例检验是检验n次独立重复试验中,事件A出现的频率大小与给定频率之间是否存在显著差异的统计分析方法。双样本比例检验有两个总体,它们分别含有某种性质的个体的比率为P1和P2,检验的依据来自这两个总体的独立样本,检验关于两个总体比率是否有显著性差异。

样本比例指的是随机试验中某种指定事件出现的概率。随机试验中某种指定事件出现叫做“成功”,把一次实验成功的概率叫做P。

对于假设H0:P=P0,在原假设成立的前提下,如果P的大小在0.1和0.9之间,并且样本容量足够大,大到足以满足时;近似的有检验统计量:,其中P是样本比例。

如果规定显著性水平为a,在双尾、左单尾和右单尾三种不同情况下:拒绝域分别为:

相关应用

单样本比例检验是检验关于比率的假设。假设总体中具有某种性质的个体的比率为p,根据来自总体的一个样本,检验比率p是否等于已知的某个常数。此检验适合于样本容量较大(一般≥30)的情形。

双样本比例检验是检验两个独立样本在n次独立重复试验中,其中一个样本序列和另外一个样本序列中事件A发生的频率大小的比较,即通过对样本进行二值概率检验,检验两个二值样本(0,1)中“1”出现的比例是否相等。

参考资料

1 贾俊平编著,统计学,4版,北京:中国人民大学出版社,2011

2 陈希孺.概率论与数理统计.合肥:中国科学技术大学出版社,1992

3 盛骤,谢式千,潘承毅:概率论与数理统计,第四版,北京:高等教育出版社,2008

4 何晓群编著,现代统计分析方法与应用.第二版,中国人民大学出版社2007

5 马克威分析系统使用教程,http://www.tenly.com

实例

设事件A和B在一次试验中发生的概率为X1和X2,进行n次独立重复试验,记X为发生的次数,X=0为不发生,X=1为发生。试对数据作样本比例检验。

编号 X1 X2
1 0 1
2 0 1
3 0 1
4 0 1
5 0 1
6 0 1
7 1 0
8 0 1
9 0 1
10 1 0

1、单样本比例检验

对X1作单样本比例检验,检验发生概率等于0.5的可能性大小。取显著性水平等于0.05;原假设为H0:P=0.5;备择假设为H1:P0.5。

检验结果:

Z统计量 P 值 p的95.00%置信区间
1.8974 0.0578 (0.5521 , 1.0479)

从检验结果中的P值>0.05,所以接受原假设,认为A事件在一次试验中发生的概率等于0.5。

2、双样本比例检验

对数据X1与X2进行双样本比例检验。取显著性水平为0.05,原假设为H0:P1=P2;备择假设为H1:P1P2。

检验结果为:

Z统计量 P 值 比例差的95.00%置信区间
2.6833 0.0073 (0.1617 , 1.0383)

从检验结果中的P值<0.05,所以拒绝原假设,认为事件A和B在一次试验中发生的概率是不相等的。

输入输出

输入变量类型:整型、浮点型

输入数据尺度:标量型、名义型、有序型

输出结果:比例检验结果表:根据计算结果显示的显著性水平(p值)与设定的显著性水平(5%或其他)比较,若小于显著性水平则拒绝原假设。

相关条目

假设检验、原假设、备择假设、P值

优缺点

优点:当我们对一件事情本身的真实性存在怀疑时,想要验证这件事情的真实性有多大的时候,假设检验可以辅助我们对这个问题作出决策。其基本原理是先对总体的特征作某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作推断。

缺点:1)对样本容量有要求,一般要求样本容量大于30以上。2)显著性水平的取值不一样的时候,对样本量有影响。

确定