(1)以数据文件“马克威通用数据1.mkw”为例,检验卡方检验算法的操作。首先,在工作区内,打开建模分析工作流:“基础分析→非参数检验→卡方检验”,接着选择数据源,然后设置算法中的参数,最后点击运行按钮。
其中各类参数的含义如下:
数据截尾:当样本出现奇异值时,可以用数据截尾去掉这些奇异值。数据截尾会去掉观测样本中最大和最小的百分之个观测。
输出频率分析详表:查看观测样本在各个区间出现的观测个数、预期个数、预期与实际个数的差值。
待检验分布:选择指定的理论分布。系统提供了十一种理论分布。其中连续型的分布有:均匀分布、正态分布、指数分布、Gamma分布、逻辑分布、半正态分布和对数正态分布(其中,对数正态分布需要用户自定义参数)。离散型分布有:二项式分布、几何分布、泊松分布、离散均匀分布。其零假设是:样本来自的总体与指定的理论分布无显著差异。
离散变量给定分布:指定已知总体的各分类构成比。如果用户预先知道观测样本会出现的取值以及该取值发生的概率,则可以使用这一选项,用手工输入记录值以及它发生的概率并检验样本是否符合预期。
设定参数:对于给选中的理论分布设定参数。如果不选择用户自定义参数的话,系统将会自动计算参数。
检验变量“交易单价”是否服从某种分布。具体的参数设置如下所示:
图 0-1 卡方检验-属性设置(2)输出结果
选择变量“交易单价”进入变量表,双击“运行”节点,进入分析过程,结果如下图:
图 0-2 卡方检验-树形结果列表 图 0-3 卡方检验-离散均匀分布 图 0-4 卡方检验-检验分析结果(3)结果说明
若给定显著性水平为0.05,检验的P值为0.9905,故认为交易单价服从离散均匀分布。
输入变量变量表数据类型:整型、浮点型、布尔型
输入数据尺度:标量型、名义型、有序型
卡方检验是非参数统计中拟合优度检验方法的一种,用于检验样本所在总体是否服从已知的理论分布。
卡方检验具体做法是,先按照已知总体的构成比分布计算样本中各类别的期望频数,然后求观测频数和期望频数的差值,最后计算出卡方统计量,利用卡方分布求出P值,以得出检验结论。
输出结果:
分布情况:给出所要检验变量服从某种分布的均值和方差,列出观测区间的频数、期望频数和方差。
卡方检验结果:给出检验的结果,根据计算结果显示的显著性水平(p值)与设定的显著性水平(5%或其他)比较,若小于显著性水平则拒绝原假设。
订购用户 | 订购时间 | 年限 | 运行环境 | 版本 |
1506****206 | 2020-08-31 15:42:00 | 1年 | Windows | 单机版 |
1506****206 | 2020-08-31 15:41:19 | 1年 | Windows | 单机版 |
1305****178 | 2019-12-27 19:47:09 | 1年 | Windows | 单机版 |
1811****398 | 2018-07-23 13:48:09 | 1年 | Windows | 单机版 |
1840****220 | 2018-06-01 09:31:08 | 1年 | Windows | 单机版 |
1881****035 | 2018-03-30 11:51:40 | 1年 | Windows | 单机版 |
1398****741 | 2017-12-29 09:10:30 | 1年 | Windows | 单机版 |
1367****349 | 2017-12-23 09:32:07 | 1年 | Windows | 单机版 |
1556****001 | 2017-08-10 23:45:25 | 1年 | Windows | 单机版 |
1358****215 | 2017-07-07 15:29:52 | 1年 | Windows | 单机版 |