SAS系统和数据分析Wilcoxon秩和检验

上传人:泽*** 文档编号:74197145 上传时间:2022-04-13 格式:DOCX 页数:15 大小:144.44KB
收藏 版权申诉 举报 下载
SAS系统和数据分析Wilcoxon秩和检验_第1页
第1页 / 共15页
SAS系统和数据分析Wilcoxon秩和检验_第2页
第2页 / 共15页
SAS系统和数据分析Wilcoxon秩和检验_第3页
第3页 / 共15页
资源描述:

《SAS系统和数据分析Wilcoxon秩和检验》由会员分享,可在线阅读,更多相关《SAS系统和数据分析Wilcoxon秩和检验(15页珍藏版)》请在装配图网上搜索。

1、第二十八课Wilcoxon 秩和检验一、 两样本的 Wilcoxon 秩和检验两样本的 Wilcoxon 秩和检验是由 Mann ,Whitney 和 Wilcoxon 三人共同设计的一种检验,有时也称为 Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用 t 检验比较均值。但当这两个条件都不能确定时,我们常替换 t 检验法为 Wilcoxon 秩和检验。Wilcoxon 秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。如果原假设两个独立样本来自相同的总体为真,

2、那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。设两个独立样本为:第一个x 的样本容量为n1 ,第二个 y 样本容量为 n2 ,在容量为n n1n2 的混合样本(第一个和第二个)中,x 样本的秩和为 Wx , y 样本的秩和为 Wy ,且有:Wx W y1 2nn(n1)(28.1)2我们定义:W1n1 (n11)(28.2)Wx2W2n2 (n21)(28.3)W y2以 x 样本为例,

3、 若它们在混合样本中享有最小的n1个秩,于是 Wxn1 ( n11) ,也是 Wx2可能取的最小值;同样 Wy 可能取的最小值为n2 ( n21) 。那么, Wx 的最大取值等于混合样2n(n1)n2(n21)本 的总 秩和 减去 Wy 的 最小值 ,即2; 同 样, Wy 的 最大取 值等 于2n( n 1)n1 (n1 1)中的W1和W2均为取值在 0 与2。 所 以 , 式 (28.2) 和 式 (28.3)2上海财经大学经济信息管理系IS/SHUFEPage 1 of 15n(n 1)n1 (n1 1)n2 (n21)222n1 n2 的变量。 当原假设为真时, 所有的 xi 和 yi

4、 相当于从同一总体中抽得的独立随机样本,xi 和 yi 构成可分辨的排列情况,可看成一排n 个球随机地指定 n1 个为 x 球,另 n2个为 y球,共有 Cnn 2 种可能, 而且它们是等可能的。基于这样的分析,在原假设为真的条件下不难求出W1 和 W2 的概率分布,显然它们的分布还是相同的,这个分布称为样本大小为n1 和 n2 的 Mann-Whitney-Wilcoxon分布。一个具有实际价值的方法是,对于每个样本中的观察数大于等于8 的大样本来说,我们可以采用标准正态分布z 来近似检验。 由于 W1 的中心点为 n1n2,根据式 (28.2) ,Wx 中心点2为:n1 n2 n1 (n1

5、1) n1 (n1 n21)(28.4)222Wx 的方差2从数学上可推导出:2n1n2 (n1 n21)(28.5)12如果样本中存在结值,将影响到公式(28.5) 中的方差,按结值调整方差的公式为:2n n (n n21)n1n2( 3jj )121(28.6)1212(n1n2 )( n1n21)其中,j 为第 j 个结值的个数。结值的存在将使原方差变小,这是一个显然正确的事实。标准化后 Wx 为:n1 (n1 n21)0.5Wx0.5Wx2 N(0,1)zn1 n2 ( n1n21)n1 n2( 3j)(28.7)1212(n1 n2 )(n1n21)其中,分子加0.5 或减 0.5

6、是为了对离散变量进行连续性修正,对于W x 大于 0 减 0.5修正,对于 W x小于 0 加 0.5 修正。例 28.1 某航空公司的 CEO 注意到飞离亚特兰大的飞机放弃预订座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预订上海财经大学经济信息管理系IS/SHUFEPage 2 of 15座位的旅客。获得一个从亚特兰大起飞的9 次航班和从芝加哥起飞的8 次航班上放弃预订座位的旅客人数样本,见表28.1 中的第2列和第 4列。表 28.1放弃预订座位的旅客人数及统一秩值航班亚特兰大( x 组)芝加哥( y 组)次数放弃人数统一编秩放弃人数统

7、一编秩1115.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和Wx96.5Wy56.5如果假定放弃预订座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t 检验。但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验。将 x 组与 y 组看成是单一样本进行编秩,见表 28.1 中的第 3 列和第 5 列。最小值是8,秩值为 1,最大值是25,秩值为17,有两个结值10 和 11,两个 10 平均分享秩值 3 和 4 为 3.5,两个 11 平均分享秩

8、值 5 和 6 为 5.5。如果两组放弃预订座位的旅客人数是相同的,那么我们期望的两组秩和Wx 和 Wy 大约是相同的;如果两组放弃预订座位的旅客人数是不相同的,那么我们期望的两组秩和Wx 和 Wy 也是非常不相同的。注意到 n1 9, n28, Wx =96.5, Wy =56.5, H 0 : 两组放弃预订座位旅客人数的分布是相同的。标准正态分布z 值的计算结果为96.59(981)0.5z21.445159(8)(9 81)9(8)(8 2 8 2)1212(98)(981)如果设定显著水平0.05,我们知道标准正态分布在0.05 显著水平时,上临界值为1.645,下临界值为1.645,

9、由于 1.4451.645,因此得到的是相同的结果,不能拒绝原假设。另外,要特别注意的是由于在连续型分布中随机地抽出n 个样本,几乎极少可能存在有些值相等的情况,但在社会经济中有很多离散变量,很可能存在数值相同的情况,即样本中存在着“结” 。我们处理“结”的方法采用分享平均秩,但当大量“结”存在时,将可能直接影响 Wx 的方差, 因此需要把式 (28.5) 中的方差修正为式(28.6) 。但在手工计算和结值不多的情况下,常使用未修正方差来简化计算,因为与修正方差的计算结果比较只存在一些小差异,大多数情况下不影响最终的推断结果。二、 单因子非参数方差分析的npar1way 过程单因子非参数方差分

10、析的 npar1way 过程是分析变量的秩, 并计算几个基于经验分布的函数( EDF )和通过一个单因子分类变量的响应变量确定的秩得分的统计量。秩的得分计算分成四种: Wilcoxon 得分、中位数得分、 Savage得分和 Van der Waerden 得分。然后,再由秩得分计算简单的线性秩统计量,由这个秩统计量可以检验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF 检验下,检验这个变量分布在不同组中是否分布相同。秩得分的统计量也可以先用 proc rank 过程计算秩得分,然后用 proc anova 过程分析这些秩得分而得到。1. 四种不同的秩得分计算用以下公式定义的统计

11、量:nSC i a(Ri )(28.8)i 1称为线性秩统计量。其中,Ri 是第 i个观察的秩, a( Ri ) 是秩得分, Ci 是一个指示向量(由0 和 1 组成),它表示了第i 个观察所属的类,n 是观察的总数。 npar1way 过程的四种不同的a( Ri ) 秩得分计算为:(1) Wilcoxon 得分在Wilcoxon得分中:a( Ri ) = Ri(28.9)它对 Logistic 分布的位置移动是局部最优的。在计算两样本情况下的Wilcoxon过程对零假设下的渐进标准正态分布的z 统计量进行一个连续的+0.5 和 0.5秩和统计量时,校正。(2) Median 得分Median

12、得分又称为中位数得分。当观察的秩大于中位点时,中位数得分为1,否则为0,上海财经大学经济信息管理系IS/SHUFEPage 4 of 15即:a( Ri ) 1当Ri(n 1) / 2(28.10)a( Ri ) 0当Ri(n 1) / 2对于双指数分布,中位数得分是局部最优。(3) Van der Waerden 得分Van der Waerden得分简称为VW 的得分。它是对正态分布的次序统计量的期望值的近似,即:a(Ri ) = F1 ( Ri/(n1)(28.11)其中, F1 (x) 函数是标准正态的累积分布函数的反函数,这个得分对正态分布是最优的。(4) Savage得分Savag

13、e 得分是指数分布的次序统计量的期望值。减去1 使得得分以0 为中心,即:Ria( Ri ) =1 /(n i 1) 1(28.12)i1Savage 得分在指数分布中比较尺度的不同性或在极值分布中的位置移动上是最优的。2. npar1way 过程说明proc npar1way 过程一般由下列语句控制:procnpar1waydata= 数据集 ;class分类变量 ;var变量列表 ;by变量列表 ;run ;为了使用 proc npar1way 过程,必须调用proc 和 class 语句。其余语句是供选择的。(1) proc npar1way 语句的选项anova 对原始数据执行标准方差

14、分析。edf 计算基于经验分布函数(EDF )的统计量,如Kolmogorov-Smirnov、Cramer-Von Meses 、 Kuiper 统计量。missing 把 class变量的缺失值看作一个有效的分类水平。median 执行一个中位数得分分析。对于两样本产生一个中位数检验,对于更多样本产生一个Brown-Mood 检验。savage 执行一个Savage 得分分析。该检验适用于数据服从指数分布的组间比较。vw 执行一个Van der Waerden 得分分析。 这是一个通过应用反正态分布累积函数得到近似的正态得分。对于两个水平情况,这是一个标准Van der Waerden检验

15、。上海财经大学经济信息管理系IS/SHUFEPage 5 of 15wilcoxon 对数据或 Wilcoxon 验一样;对于任何数量的水平,这是一个得分进行秩分布。对于两个水平,它与Wilcoxon 秩和检Kruskal-Wallis 检验。对于两样本情况,该过程使用一个连续的校正。(2) class语句class 语句是必需的, 它指定一个且只能一个分类变量。该变量用来标识数据中的各个类。Class 语句变量可以是字符型或数值型。(3) var 语句var 语句命名要分析的响应变量或自变量。如果省略var 语句, 过程分析数据集中除class语句指定的数据变量外的所有数值型变量。(4) b

16、y 语句一个 by 语句能够用来得到由 by 变量定义的几个观察组,行分析。当一个 by 语句出现时,过程希望输入的数据集已按并用 proc npar1wayby 变量排序。过程分别进三、实例分析例 28.1 的 SAS 程序如下:data study.noshows ;do group=1 to 2;input n;do i=1 to n;input x ;output;end;end;cards;911 15 10 18 11 20 24 22 258;proc npar1way data=study.noshows wilcoxon;class group;var x;run;程序说明:

17、 建立输入数据集noshows,数据的输入和成组t 检验相同,先输入本组数据的总数,然后输入组中每个数据。分组变量为group ,共有两组取值为1 和 2。输入变量为x,存放每组中的数据。过程步调用npar1way 过程,后面用选择项wilcoxon 要求进行wilcoxon秩和检验。要注意,如果两组样本是配对样本,应该使用配对t 检验或 wilcoxon 符号检验,因为使用wilcoxon 秩和方法, 将损失配对信息。class 语句后给出分组变量名group ,var 语句后给出要分析的变量x。主要结果如表28.2 所示。上海财经大学经济信息管理系IS/SHUFEPage 6 of 15表

18、 28.2用 npar1way 过程进行 Wilcoxon 秩和检验的输出结果NPAR1WAY PROCEDUREWilcoxon Scores (Rank Sums) for Variable XClassified by Variable GROUPSum ofExpectedStd DevMeanGROUPNScoresUnder H0Under H0Score1996.500000081.010.379561410.72222222856.500000072.010.37956147.0625000Average Scores Were Used for TiesWilcoxon 2-

19、Sample Test (Normal Approximation)(with Continuity Correction of .5)S = 56.5000Z = -1.44515Prob |Z| =0.1484第二十九课结果说明:组1 和组 2 的秩和( Sum of Scores)分别为 96.50 和 56.50。原假设(组 1 和组 2 的总体分布相同)为真时,期望秩值( Expected)分别为( 96.50+56.50) 9/( 9+8) =81.0 和( 96.50+56.50) 8/(9+8) =72.0,标准差( Std Dev)按公式 (28.6)计算为10.379561

20、4。每组平均得分( Mean Score)分别为 96.50/9=10.7222222 和 56.50/ 8=7.0625000。Wilcoxon 两样本秩和统计量(较小的秩和) S = 56.5000,正态近似检验统计量 Z = 1.44515(连续性修正因子为 0.5,加在分子上),正态分布的双尾 p 值之和为 0.1484,不能拒绝原假设。同上海财经大学经济信息管理系IS/SHUFEPage 7 of 15时,还给出了近似 t 检验和卡方检验的结果:近似 t 检验的 p=0.1677,近似卡方检验统计量为 2.2300,自由度为 1,p=0.1354。结果都是相同的,不能拒绝原假设。 完

21、全随机设计 Kruskal-Wallis 秩和检验四、完全随机设计的Kruskal-Wallis秩和检验方差分析过程关注三个或更多总体的均值是否相等的问题,数据是被假设成具有正态分布和相等的方差,此时F 检验才能奏效。但有时采集的数据常常不能完全满足这些条件。在两两样本比较时,我们不妨尝试将数据转换成秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。在比较两个以上的总体时,广泛使用非参数的Kruskal-Wallis秩和检验,它是对两个以上的秩样本进行比较,本质上它是两样本时的Wilcoxon 秩和检验方法在多于两个样本时的推广。Kruskal-Wallis 秩和检验,首先要

22、求从总体中抽取的样本必须是独立的,然后将所有样本的值混合在一起看成是单一样本,再把这个单一的混合样本中的值从小到大排序,序列值替换成秩值,最小的值给予秩值1,有结值时平分秩值。将数据样本转换成秩样本后,再对这个秩样本进行方差分布,但此时我们构造的统计量KW 不是组间平均平方和除以组内平均平方和,而是组间平方和除以全体样本秩方差。这个KW 统计量是我们判定各组之间是否存在差异的有力依据。设有 k 组样本, ni 是第 i 组样本中的观察数,n 是所有样本中的观察总数,Ri 是第 i 组样本中的秩和, Rij 是第 i 组样本中的第j 个观察值的秩值。需要检验的原假设为各组之间不存在差异, 或者说

23、各组的样本来自的总体具有相同的中心或均值或中位数。在原假设为真时,各组样本的秩平均应该与全体样本的秩平均12nn 1 比较接近。所以组间平方n2和为kRi2n1组间平方和ni(29.1)ni2i 1恰好是刻画这种接近程度的一个统计量,除以全体样本秩方差,可以消除量纲的影响。样本方差的自由度为 n 1。所以,全体样本的秩方差为1knin 12全体样本的秩方差 =1 i 1Rij(29.2)nj 12上海财经大学经济信息管理系IS/SHUFEPage 8 of 151nn12=i1 i 12n1nn(n1)2=i 2n1i14=1n(n1)( 2n1)n( n 1)2164nn(n1)=12因此,

24、 Kruskal-Wallis 秩和统计量 KW 为:KW组间平方和全体样本的秩方差12kRin12ni(29.3)n(n1) ini2112kRi23(n1)n(n1) ini1如果样本中存在结值,需要调整公式(4.3.3)中的 KW 统计量,校正系数C 为:C 1(j3j)(29.4)n3n其中, j 第 j 个结值的个数。调整后的KW c 统计量为:KWcKW /C(29.5)如果每组样本中的观察数目至少有5 个,那么样本统计量KWc 非常接近自由度为 k1的卡方分布。因此,我们将用卡方分布来决定KWc 统计量的检验。例 29.1 某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,

25、公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本,见表 29.1 中的第 2、4、 6 列所示。制造商想知道来自这三个不同的大学的雇员在管理岗位上的表现是否有所不同。表 29.1来自三个不同大学的雇员得分及统一秩值雇员大学 A统一编秩大学 B统一编秩大学 C统一编秩12536095072701220270123609304609485171518015.5595204069018.569018.5355701278015.57514上海财经大学经济信息管理系IS/SHUFEPage 9 of 15秩和组A秩和95组B秩和27组 C秩和88为了计算 K

26、W 统计量,我们首先必须将来自三个大学的20 名雇员统一按考核成绩编排秩值,见表 29.1 中的第 3、5、7 列所示。本例中, n17, n26, n3 7, n20, R195,R2 27, R388, k3, H 0 : 三个总体的考核成绩分布是相同的。我们用(29.3) 式计算KW 统计量为:KW12(95)2(27)2(88) 21)8.9163763(2020(21)7用 (29.4) 式计算校正系数 C,从表 29.1 中我们可以发现, 相等成绩值和相等的个数分别为60分 3个,70 分 3个,80 分 2个,90分 2个。所以:(333333232232)C 1203200.9

27、925调整后的 KW c 为:KWcKW / C8.9163/ 0.99258.9839查表可知道,自由度为k12 的卡方分布,在0.05 显著水平下,分布的上尾临界值为 5.99,由于8.985.99,因此拒绝原假设。所以,秩和最低的B 组至少与秩和最高的组是不同的。A五、 freq 频数过程Freq 频数过程可以生成单向和n 向的频率表和交叉表。对于双向表 (二维表),该过程计算检验统计量和关联度。对于n 向表,该过程进行分层分析,计算每一层和交叉层的统计量。这些频数也能够输出到SAS 数据集里。1. freq 过程说明proc freq 过程一般由下列语句控制:procfreqdata=

28、 数据集;by变量列表;tables交叉表的表达式;weight变量 ;output ;run ;该过程 proc freq 语句是必需的。 其余语句是供选择的。 另外,该过程只能使用一个 output 语句。2. proc freq 语句的选项上海财经大学经济信息管理系IS/SHUFEPage 10 of 15order=freq/data/internal/formatted 规定变量水平的排列次序。freq 表示按频数下降的次序, data 表示按输入数据集中出现的次序, internal 表示按非格式化值的次序 (缺省值), formatted按格式化值的次序。formachar (1

29、,2,7)=三个字符 规定用来构造列联表的轮廓线和分隔线的字符。缺省值为 formachar(1,2,7)= | +,第一个字符用来表示垂直线,第二个字符用来表示水平线,第三个字符用来表示水平与垂直的交叉线。page 要求 freq 每页只输出一张表。否则,按每页行数允许的空间输出几张表。noprint 禁止 freq 过程产生所有输出。3. by 语句一个 by 语句能够用来得到由 by 变量定义的分组观察,并分别进行分析。过程要求输入的数据集已按 by 变量排序。4. tables语句可以包括多个tables 语句。如果没有tables 语句,对数据集中的每个变量都生成一个单向频数表。如果

30、 tables 语句没有选项, 则计算 tables 语句中规定变量每个水平的频数、累计频数、占总频数的百分比及累计百分比。Tables 语句中的交叉表的表达式,请参见第二章第二节proc tabulate 过程中的table 语句的用法。Tables 语句中的主要选项如下:all 要求计算所有选项的检验和度量,包括chisq、 measures 和 cmh。chisq 要求对每层是否齐性或独立性进行卡方检验,包括pearson 卡方、似然比卡方和 Mantel-Haenszel 卡方。并计算依赖于卡方统计量的关联度,包括 phi 系数、列联系数和 Cramer V 。对于 2 2 联列表还自

31、动计算Fisher的精确检验。cmh 要求Cochran-Mantel-Haenszel卡方统计量,用于2 维以上表时,检验行变量和列变量是否有线性相关。exact 要求对大于2 2 表计算Fisher的精确检验。Fisher的精确检验是假设行与列的边缘频数固定,并且在零假设为真时,各种可能的表的超几何概率之和。measures 要求计算若干个有关相关的统计量及它们的渐近标准误差。alpha=p 设定 100( 1 p) %置信区间。缺省值为alpha= 0.05。scores=rank/table/ridit/modridit 定义行 / 列得分的类型以便用于cmh 统计量和pearson

32、相关中。在非参数检验中,一般常用scores=rank,用于指定非参数分析的秩得分。cellchi2 要求输出每个单元对总卡方统计量的贡献。cumcol 要求在单元中输出累计列百分数。expected 在独立性(或齐性)假设下,要求输出单元频数的期望值。deviation 要求输出单元频数和期望值的偏差。missprint 要求所有频数表输出缺失值的频数。missing 要求把缺失值当作非缺失值看待,在计算百分数及其他统计量时包括它们。out= 输出数据集 建立一个包括变量值和频数的输出数据集。sparse 要求输出在制表要求中变量水平的所有可能组合的信息。list 以表格形式打印二维表。no

33、cum/norow/nocol/nofreq/noprint 分别不输出累计频率数、行百分率、列百分上海财经大学经济信息管理系IS/SHUFEPage 11 of 15率、单元频数、频数表。5. weight 语句通常每个观察对频数计数的贡献都是 1。然而当使用 weight 语句时,每个观察对频数计数的贡献为这个观察对应的权数变量的值。6. output 语句该语句用于创建一个包含由proc freq 过程计算的统计量的SAS 数据集。由 output 语句创建的数据集可以包括在tables 语句中要求的任意统计量。当有多个tables 语句时, output 语句创建的数据集的内容相应于最

34、后要求的那个表。六、实例分析例 29.1 的 SAS 程序如下:data study.colleges ;do group=1 to 3;input n;do i=1 to n;input x ;output;end;end;cards;725 70 60 85 95 90 80660 20 30 15 40 35750 70 60 80 90 70 75;proc npar1way data=study.colleges wilcoxon;class group;var x;run;程序说明:建立输入数据集colleges ,数据的输入和完全随机化方差分析的数据输入完全相同,先输入本组数据的

35、总数,然后输入组中每个数据。分组变量为group,共有三组取值为 1、2 和 3。输入变量为x,存放每组中的数据。过程步调用npar1way 过程,后面用选择项wilcoxon ,当样本数大于两个时,自动进行多样本的Kruskal-Wallis秩和检验。 class 语句后给出分组变量名group ,var 语句后给出要分析的变量x。主要结果如表29.2 所示。表 29.2用 npar1way 过程进行多样本比较的Kruskal-Wallis 秩和检验输出结果上海财经大学经济信息管理系IS/SHUFEPage 12 of 15NPAR1WAY PROCEDUREWilcoxon Scores

36、(Rank Sums) for Variable XClassified by Variable GROUPSum ofExpectedStd DevMeanGROUPNScoresUnder H0Under H0Score1795.073.500000012.571898513.57142862627.063.000000012.07868944.50000003788.073.500000012.571898512.5714286Average Scores Were Used for Ties结果说明:组1、组 2 和组 3 的秩和( Sum of Scores)分别为 95.0、27.

37、0 和 88.0。原假设(组 1、组 2 和组 3 的总体分布相同)为真时,期望秩值(Expected)分别为( 95+27+88 )7/(7+6+7 )=73.50、(95+27+88 ) 6/( 7+6+7)=63.00 和(95+27+88 ) 7/( 7+6+7)=73.50,各组的标准差 ( Std Dev )分别为 12.5718985、12.0786894 、12.5718985 。每组平均得分 ( MeanScore)分别为95/7=13.5714286 、27/6=4.50 和 88/7=12.5714286 。按公式 (29.5)调整后多样本的 Kruskal-Wallis

38、 秩和检验统计量为 8.9839 ,用自由度为 DF=3 1=2 的卡方分布近似, 得到大于近似卡方检验统计量 8.9839 的概率为 p =0.01120.05 ,拒绝原假设。结论为各组的总体分布的差异是有统计学意义的。根据平均秩和的结果,组1 的最高,组2 的最低,因此,至少组 1 和组 2 的差异是显著的。例 29.1 的 SAS 程序我们还可以采用freq 过程,在tables 语句中的选项用scores=rank 和cmh,查看第二项统计量既为Kruskal-Wallis检验,程序如下:程序 CHAP4_04_2.SASproc freq data=study.colleges fo

39、rmachar= |-|+-;tables group*x /scores=rank cmh ;run;程序说明: freq 过程选项formachar= |-|+- ,用来构造表格的轮廓线和分隔线的字符,由于不同操作系统中,符号编码可能有所不同,因此,缺省值可能不符合你的要求,需要你重新定义一下。 Tables group*x 语句,把组变量 group 中 3 个不同大学,与成绩变量个分组成绩(最小值为 15,最大值为 95,间隔为 5,共 14 组),构成了一个单层x3 行中 1414 列二 维 交 叉 频 率 表 , 选 项scores=rank指 定 为 非 参 数 秩 得 分 的

40、情 况 , 选 项Cochran-Mantel-Haenszel 卡方统计量。主要结果如表29.3 所示。cmh计 算表29.3用 freq 过程对每层秩得分进行Kruskal-Wallis秩和检验的输出结果上海财经大学经济信息管理系IS/SHUFEPage 13 of 15TABLE OF GROUP BY XGROUPXFrequency|Percent |Row Pct |Col Pct|15| 20|25|30|35|40|50|Total-+-+-+-+-+-+-+-+1 |0 |0 |1 |0 |0 |0 |0 |7|0.00|0.00|5.00 |0.00 |0.00 |0.00

41、|0.00|35.00|0.00|0.00|14.29 |0.00 |0.00 |0.00 |0.00 |0.00|0.00| 100.00 |0.00 |0.00 |0.00 |0.00|-+-+-+-+-+-+-+-+2 |1 |1 |0 |1 |1 |1 |0 |6|5.00|5.00|0.00 |5.00 |5.00 |5.00|0.00|30.00|16.67 |16.67|0.00|16.67 |16.67 |16.67 |0.00 | 100.00 | 100.00 |0.00 | 100.00 | 100.00 | 100.00 |0.00 |-+-+-+-+-+-+-+-+3

42、 |0 |0 |0 |0 |0 |0 |1 |7|0.00|0.00|0.00 |0.00 |0.00 |0.00|5.00|35.00|0.00|0.00|0.00 |0.00 |0.00 |0.00|14.29 |0.00|0.00|0.00 |0.00 |0.00 |0.00| 100.00|-+-+-+-+-+-+-+-+Total1111111205.005.005.005.005.005.005.00100.00(Continued)|60|70|75|80|85|90|95|Total-+-+-+-+-+-+-+-+1 |1 |1 |0 |1 |1 |1 |1 |7|5.00|5

43、.00|0.00 |5.00 |5.00 |5.00|5.00|35.00|14.29 |14.29|0.00|14.29 |14.29 |14.29 |14.29 |33.33 |33.33|0.00|50.00 | 100.00 |50.00 | 100.00 |-+-+-+-+-+-+-+-+2 |1 |0 |0 |0 |0 |0 |0 |6|5.00|0.00|0.00 |0.00 |0.00 |0.00|0.00|30.00|16.67 |0.00 |0.00 |0.00 |0.00 |0.00 |0.00 |33.33 |0.00 |0.00 |0.00 |0.00 |0.00 |0.00 |-+-+-+-+-+-+-+-+3 |1 |2 |1 |1 |0 |1 |0 |7|5.00| 10.00 |5.00 |5.00 |0.00 |5.00 |0.00 |35.00结果说明:输出一张单层的3 行 14 列的频数表,行列交叉单元中的第一个值为单元频数( Frequency ),即两个变量group 和 x 的组合值出现的频数,第二个值为单元百分数(Percent ) , 即出现的频数在总频数中的百分比,第三个值为行百分数(Row Pct ), 即出现的频数在所在行总频数中的百分比,第四个值为列百分数(Col Pct) , 即出现的频数在所在上海财经大学经济信息管理系

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!