第十一章 非参数检验

上传人:jin****ng 文档编号:177262257 上传时间:2022-12-25 格式:DOCX 页数:16 大小:74.94KB
收藏 版权申诉 举报 下载
第十一章 非参数检验_第1页
第1页 / 共16页
第十一章 非参数检验_第2页
第2页 / 共16页
第十一章 非参数检验_第3页
第3页 / 共16页
资源描述:

《第十一章 非参数检验》由会员分享,可在线阅读,更多相关《第十一章 非参数检验(16页珍藏版)》请在装配图网上搜索。

1、第一节 非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数” 非参数模型:缺乏总体分布模式的信息。(二)非参数检验的定义 非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。(三)非参数检验的优点和缺点:1、优点: 一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。 计算简便。2、缺点: 统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从 其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提 取一般的信息,相对参数统计检验方法会浪费一些信息。(四)非参数检验的特点:1、它不需要严格的前提

2、假设;2、特别适用于顺序数据;3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。第二节 两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。秩和检验法也叫 Mann-Whitney-Wilcoxon 检验,它常被 译为曼一惠特尼一维尔克松检验,简称M-W-W检验,也称Mann-Whitney U检验。秩和检 验法与参数检验法中独立样本的t检验法相对应。当“总体正态”这一前提不成立时,不能 用t检验,可以用秩和检验法。n (n + n +1 1 2(一)秩统计量 秩统计量指样本数据的排序等级。假设从总体中反复抽取样本

3、,就能得到一个对应于样 本容量ni和n2的秩和U的分布。这是一个间断而对称的分布,当件和n2都大于10时,秩 和 T 的分布近期近似正态分布,其平均数和标准差分别为1 1其检验值为Z TZ 二TQT(二)计算过程1、小样本:两个样本容量均小于10 (n110,n210)例 11-1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对 5 名学生用针对 某一工种的模拟器进行训练,内外让6 名学生下车间直接在实习中训练,经过同样的时间后 对两组人进行该工种的技术操作考核,结果如下:模拟器组: 56,62,42,72,76实习组: 68,50,84,78,46,92假设两组学生初始水平相同,则两

4、种训练方式有无显著差异?表 11-1 两种训练方式的成绩考核成绩成绩排列等级等级和模拟器组56421( 5 人)6256442625T = 2517272776768实习组68462( 6 人)5050384686T = 41787892468410929211检验过程:1建立假设H 乙R0 : 1H 乙R=工RQ R22即两样本无显著差异即两样本有显著差异2计算统计量1)将数据从小到大排列,见上表。2)混合排列等级,即将两组数据视为一组进行等级排列,见上表3)计算各组的秩和,并确定卩值,即T = min(片,T2)= min (25,41)=253比较与决策若TVTVT2,则接受虚无假设,拒

5、绝研究假设。若TWT,或T三T2,拒绝虚无假设,接受研究假设。查秩和检验表,当 n1=5, n2=6, T1=19, T2=41, 因为 192541, 即 T1T10,n210)例 11-2:对某班学生进行注意稳定性实验男生与女生的实验结果如下,试检验男女生之 间注意稳定性有否显著差异?男生:(片=14)19,32,21,34,19,25,25,31,31,27,22,26,26,29女生:(比=17)25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32检验过程:1建立假设H 乙R =乙R2计算统计量1)求秩和T。先混合排列等级,再计算算 1和

6、和2,最后确定T。排序如下:男生: 1.5,23.5,3,27,1.5,8.5,8.5,21.5,21.5,13.5,4,11.5,11.5,17,女生8.5,19.5,15,27,5,8.5,13.5,29.5,19.5,17,17,25,29.5,31,6,27,23.5T=1.5 + 23.5 + 3 + 27 +1.5 + 8.5 + 8.5 + 21.5 + 21.5 +13.5 + 4 +11.5 +11.5 +17=1742) 求 Z 值二 224,_n (n + n +1)14x(14 +17 +1)口 =-412二一t22n n (n + n +1)114 x 17 x (1

7、4 +17 +1)b =i2i2= 25.2T1212Z 二匕二 174 一 224 一 1.98 b25.2T3比较与决策Z = I98Z0.05/2,PO05,拒绝虚无假设,差异达到显著性水平。说明男女在注意 稳定性上有显著差异。、中数检验法(一)适用条件中数检验法对应着参数检验中两独立样本平均数之差的t检验。中数检验法的基本思想是将中数作为集中趋势的量度,检验不同的样本是否来自中位数相同的总体。因而其虚无假设(H0)为:两个独立样本是从具有相同中数的总体中抽取的,它也可以是双侧检验或单侧检验。双侧检验结果若有统计学意义,意味着两个总体中数有差异(并 没有方向);单侧检验结果若有统计学意义

8、,则表明对立假设“一个总体中数大于另一个总 体中数”成立。(二)计算过程例题 13-8:为了研究核糖核酸是否可以作为记忆的促进剂,研究者以老鼠为对象分成实验组与控制组。实验组注射RNA,控制组注射生理盐水,然后在同样的条件下学习走迷津,如果如下(单位:时间)。试问两组的学习成绩有无显著差异?实验组:16.7,16.8,17.0,17.2,17.4,16.8,17.1 ,17.0,17.2,17.1 ,17.2,17.5,17.216.816.3,16.9控制组:76.6,17.2,16.0,16.2,16.8,17.117.0,16.0,16.2,16.5,17.1 ,16.2,17.116.

9、816.51提出假设H : A0 : mdn二 Bmdn,即两组中位数相等,或两组成绩无显著差异a : mdn mdn ,即两组中位数不等,或两组成绩有显著差异2计算统计量1)求混合中数。将数据按大小排列,确定中数。表 13-11 中数计算表1616.216.316.516.616.716.816.91717.117.217.417.5f 2312115144511F 256891015162024293031Mdn 二 X 二 X 二 X 二 16.9N13U116222)统计多个样本在中数上下的次数,列出列联表表 13-12计数表V实验组控制组 Mdn 的次数10515V Md的次数510

10、151515303)求咒2值30 x(10 x 10 - 5 x 5)2X 2 二二 3.3315 x 15 x 15 x 153比较与决策X 2二3.33 V Xho5= 3.84 , p 0.05,差异不显著,接受虚无假设,拒绝研究假设。说明实验组与控制组在迷津学习中差异不显著,即RNA对记忆无明显的促进作用。第三节 配对样本的非参数检验方法一、符号检验法(一)、适用条件 符号检验是以正负符号作为资料的一种非参数检验程序。它是一种简单的非参数检验方 法,适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性 t 检验相对应。符号检验也是将中数作为集中趋势的量度,虚无假设是配对资料

11、差值来自中位数为零的 总体。它是将两样本每对数据之差(XiYi)用正负号表示,若两样本没有显著性差异,理 论上正负号应各占一半或不相上下。相反,若正负个数相关较大,则可能存在差异,由此表明两个样本不是来自同一总体,并可推论两样本的总体存在差异。(二)、计算过程1、小样本符号检验法NW25例 11-4:用配对设计方法对 9 名运动员不同方法训练,每一个对子中的一名运动员按传 统方法训练,另一名运动员接受新方法训练。课程进行一段时间后对所有运动员进行同一考核,结果如下。能否认为新训练方法显著优于传统方法配对123456789传统(X)858887868282707280新法(Y)908487859

12、094858892符号(X-Y)-+0+-1)建立假设单侧检验H P P0 :+ 匕-H : P PQ + 一2)3)4)5)统计符号总数N。符号总数中不包含0只包括正号和负号个数和,即N 匕+ n_ = 2 + 6 = 8 将n +,n了中的较小者记为r,即r = min n , n / = n = 2+ - +比较与决策标记配对数据之差的符号。见上表根据符号总和N及显著水平值a查符号检验临界值表,见附表15。表中列出了符号总 和与显著性水平a所对应的临界值0,其判断规则如下表。表 11-r与临界值(CR)比较P值差异显著性rr0 05P0.05不显著r0.oir r0.05。所以差异不显著

13、, 接受虚无假设,不能认为新法显著优于传统方法。2、样本容量N25时在附表15中,虽然N是从1到90,就是说N在这个范围内时都可以用查附表15的方 法,但是在世纪中当N25时常常使用正态近似法。将N分为n+和n-两部分,为二项分布,根据二项分布的原理,有11p = q = 卩=Np = N b + - 2, 2 ,Z = r -卩=r N 2vN 21 1N=、:Npq = N x x =2 22为了更接近正态分布,采用较正公式,即Z = (r + 0.05)- N 2 =TNi例 11-5:在教学评价活动中,要求学生对教师的教学进行7 点评价(即 17分),下表是某班学生对一位教师期中与期末

14、的两次评价结果,试问两次结果差异是否显著?学生期中(X)期末(Y)X Y136227-354+415-532+623-713-837-932+1013-113301212-1354+1426-1536-1614-1753+1812-1946-2032+2137-2212-2313-2446-2535-2653+2743+2856- 建立假设H P = P0 : + -H : P P一 确定正、负号数目,正负号总数N的r值n = 8 , n = 19 , N = n + n = 27 , r = min(8,19) = 8- - 计算统计量0.05,接受虚无假设,差异不显著。不能认为期中、期末两

15、次0.05/2评价结果有显著差异。二、符号等级检验法(一)适用条件维尔克松符号等级检验法(Wilcoxon Signed-Rank test)是由维尔克松提出的,又称符号 秩和检验,有时也简称为维尔克松检验法。其使用条件与符号检验法相同,也适合于配对比 较,但它的精度比符号检验法高,因为它不仅仅考虑差值的符号还同时考虑差值大小。目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对的两个相关样本 所来自的两个总体中位数是否有差别。(二)计算步骤1、小样本(N W25)检验(1)把相关样本对应数据之差值按绝对值从小到大作等级排列(注意差值为零时,零 不参加等级排列);(2)在各等级前面添上

16、原来的正负号;(3)分别求出带正号的等级和(T+)与带负号的等级和(T),取两者之中较小的 记作T;(4)根据N, T查符号等级检验表,当T大于表中临界值时表明差异不显著;小于临 界值时说明差异显著。例 11-6 :某幼儿园对 10 名儿童在刚入园时和入园一年后均进行了血色素检查,结果如 下,试问两次检查有否明显变化?儿童ABCDEFGHIJ刚入园12.311.313.015.012.015.013.512.810.011.0一年后12.014.013.813.811.414.013.513.512.014.7差值-0.32.70.8-1.2-0.6-1.000.72.03.7差值绝对值 排等

17、级184625379添符号-184-6-2-5379+1) 建立假设Ha:0 :正负号等级和无显著差异。即入园时和入园一年没有显著差异,正负号等级和有显著关系。即入园时和入园一年有显著差异,2) 求成对数据的差数D值,见上表。3) 按ID I排列顺序(不包括0)并添加符号。并将原来差值的正负号添加在等级前。4) 计算正号等级和(T+ )与负号等级和(T_),并取较小者为T值,即= 1+6+2+5=14T = min(T ,+;T+=8+4+3+7+9=31T ) min(31, 14)= 145) 根据符号总数N,查符号秩序临界值表,进行比较与决策表 13-7 单侧符号秩序检验法统计判断规则T

18、与临界值(CR)比较P值差异显著性TT0.05P 0.05不显著T0.01 VTWT0.050.01VPW0.05显著TV%PW0.01极显著当 N = n+ + n_n = 5 + 4 时,To.o5 = 6。因为,T = 14 To.o5 = 6,p 0.05,接受虚无假设,拒绝研究假设,差异不显著。说明入园时与入园一年幼儿的血色素没有明显变化。2、大样本 N25T 的分布接近正态分布,其平均数和标准差分别为:N(N +1)T4:N(N +1)2 N +1)Q =T24检验统计量:Z= T 卩Z一TQT若出现相同等级较多(超过25% )时,应采用校正统计量Z:=|T - n(n +1)/4

19、 _ 0.5Z =c: n(n + 1)(2n +1)工(t3 _ t )J_j2448式中,t为第j (j=l,2)次相持所含相同秩次的个数。如例10T,第1次相持,有 j两个差值的绝对值均为2.29,则ti=2;第2次相持,有两个差值均为11.54,则t2。于是, Y (t3 t ) = (t3 t ) + (t3 t ) 一(232) + (232)=12。j j1122例 11-7:对例 11-5 进行符号等级检验。序号1期中X3期末y10111213X-y-5工41T2A_T-1工-415亘18192021222324252627283151433114354564326272365

20、336-3-32-1-2工-4-1-2-2-22工-1秩次2127624.56615.524.5615.506624.5212F15.5615.5624.5615.515.515.515.566添号-21-27+6-24.5+6_6-15.5-24.5+6-15.50-6+6-24.5-21-2F+15.5-6-15.5+6-24.5-6-15.5-15.5-15.5+15.5+6-61) 建立假设HT = T0 :+-HT丰Ta :+2) 确定T值T = 67 , T = 311, T = min( T , T ) = T = 67+ + - +3)计算统计量 求均数U = 27 X (27

21、 +1) = 189T42)求标准差.27 %(27 +1) x (54 +1)二 41.6 T24r 67 -1893)求 Z 值Z - -2.9341.6Z = 2.93 Z0.05 2二1.96 , p 3 或 n5 时i计算出H值,然后查的X 2表,df=K-1,进行统计决策。例11-9: A、B、C、D四所学校分别选出一部分人作为本校代表队参加物理竞赛,结果如下。问四所学校成绩有否显著差异?成绩相应秩次ABCDABCD8099897610.532.5245.58891826622.526147879881752130133.58798807818.53010.589099867625

22、32.518.55.58696867322.52818.5285928671162718.51988480301510.5753.58010.5n78810ER136236132571)将数据进行排序,计算工R,见上表。2)计算统计量H 二 12 壬性-3(N +1)N (N +1)n57210)-3 x 34121136i2236 2 132 2=X (+33 x 34788= 27.53)进行统计决策,查x 2表,当df = 4 1 = 3时,x 2二7.81,H九2,拒绝原假设,说明四个代表0.050.05队成绩有显著差异。二、弗里得曼双向等级方差分析(一)适用条件弗里得曼双向等级方差分

23、析(Friedman)可解决随机区组实验设计的一些非参数检验问题。(二)检验步骤x2T12 、 nK(K +1)3n(K +1)i=112nK(K +1)i=13n(K +1)处理区组ABC112321.51.53321341.531.55132工R710.512.5125 x 3 x (3 +1)x +10.52 +12.52) 3 x 5 x (3 +1)= 3.13)进行统计决策查表 18,当 X 将数据在各区组内排序,计算工R ,见上表 计算统计量 = 2.8 时, p = 0.367 ;当 X 2 = 3.6 时, p = 0.182 ,因为 rr2.8X2 = 3.1X23.6,因此0.182(p0.367,接受原假设,说明三种实验处理没有显著差Tr异。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!