(1)以数据文件“马克威通用数据1.mkw”为例,演示双样本均值检验算法的操作。首先,在工作区内,打开建模分析工作流:“基础分析→参数检验→双样本均值检验”,接着选择数据源,然后设置算法的参数,最后点击运行按钮。
其中各类参数的含义如下:
变量表:在选入变量时,若不使用分组变量,需要同时选中两个变量方能添加至“已选变量表”。
分组变量:用来把参与运算的样本进行分组的变量。如果需要比较的数据为两个不同的变量,则不需要使用分组变量,直接选中两个变量,添加到变量表。
分组参数定义:分组参数定义包括指定分组值和指定分界值法:
指定分组值法:一般应用于二值型、布尔型和整型的数据。指定的两个不同的取值,将样本分成两个组。分组值要求设置为分组变量的一个固定取值。
指定分界值法:一般应用于连续型数据。分界值将全部观测量按分组变量值大于等于分界值和小于分界值分成两个组。分界要求设置为分组变量的最小值和最大值之间的任意一个实数。
置信度:设置置信度的值,要求为区间(0,1]之间任意值,系统默认为95%。
原假设:即认为两个变量的均值差等于某一个指定的数值,一般用H0表示。
备择假设:原假设的对立面,即认为两个变量的均值差与指定值不相等,分为单侧检验和双侧检验。单侧检验包括两个变量均值差大于或小于指定值;而双侧检验则是指两个变量均值差不等于指定值。
检验类型:包括方差已知和方差未知两种情况。方差已知时,采用常见的U检验,可以由用户指定不同变量的方差或者标准差的值;方差未知时,采用T检验,方差未知还可以分为方差相等和方差不等两种情况。
方差齐性检验:检验两个变量的方差是否相同的一种检验方法。检验的统计量主要有Levene统计量、F统计量和Bartlett统计量。方差齐性检验的结果有方差相等和方差不等两种。确定了方差是否齐性后才能判断原假设是否成立。
对变量“购买总额”进行双样本均值检验,分组变量为“是否丢失”。具体的参数设置如下所示:
图 0-1 双样本均值检验-属性设置(2)输出结果
双击“运行”节点后,进入分析过程,输出分析结果为:
图0-2 双样本均值检验-树形结果列表 图 0-3 双样本均值检验-分组统计 图 0-4双样本均值检验-假设检验检验结果(3)结果说明
由“分组统计”表可见,没有丢失的顾客有541个记录数,丢失的顾客有558个记录数,同时给出了它们的均值、标准离差和均值标准误。
由“检验结果”表可见,双尾T检验的显著性概率为0.1328,大于0.05,可以得出结论:认为丢失的顾客与没有丢失的顾客之间购买总额的均值没有显著差异。
输入变量变量表数据类型:整型、浮点型、布尔型
输入分组变量数据类型:整型、浮点型、布尔型、字符型、日期型
输入数据尺度:标量型、名义型、有序型
双样本均值检验依据来自两个总体的独立样本,检验两总体均值是否有显著差异。
对于两个来自正态总体的样本,按照方差是否已知使用不同的检验方法:方差已知时,采用常见的U检验,此时检验统计量服从标准正态分布;方差未知时,检验统计量服从T分布,采用 T检验。
输出结果:
分组统计:列出样本的统计信息。
假设检验结果:给出参数检验方差相等于方差不等的结果。
订购用户 | 订购时间 | 年限 | 运行环境 | 版本 |
1811****398 | 2018-07-23 13:48:09 | 1年 | Windows | 单机版 |
1840****220 | 2018-06-01 09:31:08 | 1年 | Windows | 单机版 |
1398****741 | 2017-12-29 09:10:30 | 1年 | Windows | 单机版 |
1398****741 | 2017-12-29 09:10:30 | 1年 | Windows | 单机版 |
1556****001 | 2017-08-10 23:45:25 | 1年 | Windows | 单机版 |
1381****657 | 2017-04-07 00:10:41 | 1年 | Windows | 单机版 |
1381****657 | 2017-04-06 22:57:30 | 1年 | Windows | 单机版 |
1397****925 | 2017-03-29 10:56:35 | 1年 | Windows | 单机版 |
1397****925 | 2017-03-29 10:56:18 | 1年 | Windows | 单机版 |
1397****925 | 2017-03-29 10:56:00 | 1年 | Windows | 单机版 |