第7章假设检验

上传人:仙*** 文档编号:28906476 上传时间:2021-09-18 格式:DOC 页数:123 大小:132KB
收藏 版权申诉 举报 下载
第7章假设检验_第1页
第1页 / 共123页
第7章假设检验_第2页
第2页 / 共123页
第7章假设检验_第3页
第3页 / 共123页
资源描述:

《第7章假设检验》由会员分享,可在线阅读,更多相关《第7章假设检验(123页珍藏版)》请在装配图网上搜索。

1、第七章 假设检验假设检验的基本原理总体参数假设检验非参数检验第一节 假设检验的基本原理假设检验的基本原理假设检验的规则与两类错误检验功效一、假设检验的基本原理假设检验是统计推断的另一项重要组成部分,是参数估计的延续,是对参数估计在统计上的验证与补充。它首先对考察总体的分布形式或总体的某些未知参数事先做出某些假设,然后根据检验对象构造合适的检验统计量并经过数理统计分析,确定在假设下,该检验统计量的抽样分布;在给定的显著性水平下,从抽样分布中得出鉴别对原先假设的拒绝域和接受域的临界值;之后由所抽取的样本资料计算样本统计量,并将样本统计量与临界统计量进行比较,从而对所提出的原假设做出统计判断:是接受

2、还是拒绝原假设。也就是从样本中所蕴含的信息来对总体情况进行判断。假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。举个例子来说,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件产品,它为次品的概率就为01.01,此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中随机抽取1件,恰好是次品,那么,我们就有理由怀疑该批产品的次品率不是很小,否则就不会那么容易地抽到次品。因此,有足够的理由否认该批产品的次品率很低的假设。通常概率要多大才能算得上是小概率呢?假设检验中把这个小概率称为

3、显著性水平 ,其取值的大小与我们能否做出正确判断有着相当大的关系。然而, 的取值并没有固定的标准,只能根据实际需要来确定。一般地, 取0.085(5),对于一些比较严格的情况,例如在一些高精密质量检验的假设检验中,它可以取0.01或者更小。 越小,所做出的拒绝原假设的判断的说服力就越强。当然,不管 有多么地小,也不能代表小概率事件没有发生的可能,这也正是假设检验与数学上“反证法”的不同之处。所以,对于拒绝或者接受,都只是统计意义上的,并不是完全意义上的。这一点在学习假设检验过程中是容易被疏忽的。事先建立假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体没

4、有发生变化的基础之上的,也就是总体参数没有显著变化。备选假设是原假设的对立,是在否认原假设之后所要接受的内容,通常这是我们真正感兴趣的一个判断。例如在上面的例子中,如果想确认次品率是否为0.01,我们可以分别建立原假设和备选假设为: H0:0=0.01%, H1:00.01% ;如果我们想确认次品率是否大于(小于)0.01,那么对应的备选假设为: H1:0>0.01% (或0<0.01% ),原假设与前面相同。由此可见,备选假设与原假设的建立不是随意的,而是要根据研究的需要来确定的。应当指出,在假设检验中,相对而言,当原假设被拒绝时,我们能够以较大的把握肯定备选假设的成立;而当原假

5、设不能被拒绝时,我们并不能断定原假设确实成立。例如,当给定的为0.01时,如果检验统计量的取值落入其发生概率不超过0.04但又大于0.01的区域时,我们不能拒绝原假设。但事实上,在原假设成立的前提下,其发生的概率最多只有0.04,因此难以断定原假设成立。如果将显著水平定为0.05,则原假设就会被拒绝。假设检验按照所检验内容的不同,可以分为参数检验和非参数检验。对已知总体分布的某个未知参数进行的检验,称为参数检验;对总体的分布形式进行的检验,则称为非参数检验。本章将分别对这两类检验进行介绍。二、假设检验的规则与两类错误(一)假设检验的规则综合上面假设检验的原理分析,给出假设检验的步骤:1根据实际

6、应用问题确定合适的原假设 H0和备选假设H1;2确定检验统计量,通过数理统计分析确定该统计量的抽样分布;3给定检验的显著性水平 ,在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;4从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。上面步骤中,对检验统计量抽样分布的确认属于高深的概率数理统计的研究内容,本处我们不作探讨。从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正就是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是

7、两端,可以将检验分为单侧检验和双侧检验。单侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于上述的情况,我们可以通过服从检验统计量的分布图来形象表示: 图7-1 双侧检验与单侧检验图中的阴影部分为拒绝域,对应的分别是双侧、左单侧、右单侧检验。实际应用中,是采用双侧检验还是单侧检验?单侧检验中,是采用左单侧还是右单侧呢?例如,某公司采取了新的销售方案,我们想检验新方案下销售收入是否与实施前的有差异,即是否等同于原来的销售收入水平,对该情况的检验就是双侧检验。如果我们想检验新方案下的销售收入水平是否有所提高,此时检验就转化为单侧检验了,而且是右侧检验。同理,如果想检验收入

8、水平是否低于实施前的收入水平,就要采用单侧检验中的左侧检验。也就是说,选用双侧、左侧或右侧检验时,要结合备选假设来考虑。又如,前面提到的次品率的例子中,如果备选假设为 H1:00.01% ,就是双侧检验;如果备选假设为H1:0<(或>) 0.01% ,就是属于左(右)单侧检验。在检验规则中,我们经常碰到两种重要的检验方法: z检验与t检验。1z检验。又称为正态分布检验,该检验认为所检验的统计量服从正态分布。例如,从正态分布总体中抽取一个样本,则样本均值 服从正态分布 ;从一般非正态分布总体中抽样,当样本容量 n很大时,样本均值 近似地服从正态分布 ,其中 , , 为总体标准差。因为

9、统计量 N(0,1) ,所以,我们可以利用标准正态分布来进行检验。根据给定的显著性水平,从标准正态分布的临界表中查得临界值 ,将 z统计量的取值与临界值比较来判断能否拒绝原假设。2 t检验。在检验中,当总体的标准差 未知时,需要用样本标准差 来代替,从而构成统计量 。同样,从 t分布的临界表中查得临界值 ,并将样本统计量的 值与其比较做出判断。(二) p值检验在上面的检验步骤中,判断最后是接受原假设还是拒绝原假设依据是,计算的样本统计量的数值与检验统计量的临界值的大小比较。此外,我们也可以根据计算的概率值p来判断能否拒绝原假设,这就是p值检验。现在在众多流行的统计计量软件中(如SAS,SPSS

10、,EXCEL等),最后的结果表中都给出了p值。p值检验的原理:建立原假设后,在假定原假设成立的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算出的检验统计量的数值的概率,这便是p值;而后将此p值与事先给出的显著性水平 进行比较,如果p值小于,也就是说,原假设对应的为小概率事件,根据上述的“小概率原理”,我们就可以否定原假设,而接受对应的备选假设。如果 p 值大于 ,我们不就能否定原假设。例如,对应上面的 检验中,如果是双侧检验,根据上面的说明,可以计算 ,若 p,那么我们就可以否认原假设,反之不能否定原假设。 p值检验与前面

11、介绍的方法得出的结论是一致的。(三)两类错误在假设检验中,对假设的检验判断是依据样本实际资料所计算的统计量的值与临界值的比较来做出的。由于样本的随机性、样本信息的分散性等原因,这种合理的“以偏概全”式的假设检验,总是无法让我们百分百的肯定所做出结论的正确性。也就是说,我们有可能会做出错误的判断,这种风险是客观存在的。例如,实际上依据真实总体情况,我们应该接受原假设H0,但根据样本信息,却做出拒绝H0的错误结论,称这种错误为“弃真”错误;此外,我们也可能犯这样的错误:实际的总体情况是应该拒绝原假设,而我们却接受了它,称此为“纳伪”错误。对于上述的两类错误,我们都希望能尽量减少其发生的概率。因此需

12、要对它们的概率进行简要分析。在假设中,我们给出了显著性水平(概率值),在“小概率事件是几乎不会发生的”原理上,如果样本资料的信息与总体信息之间的差异出现的概率小于等于 ,那么可以认为在一次试验中该事件不会发生(发生的可能性很小),从而我们就拒绝了原假设。这就是说,有的可能性发生原假设是真实的却被拒绝的情况。所以显著性水平就是我们犯“弃真”错误的可能性大小。 越小,则犯“弃真”错误的可能性就越小。因而,可以根据实际需要对显著性水平加以控制,一般取 =0.05(或者=0.1 ),这就保证犯“弃真”错误的可能性不超过5(或者1)。如果要求更加严格, 可取更小的数值。通常记为犯“纳伪”错误的可能性大小

13、。由于两类错误是一对矛盾,在其他条件不变的情况下,减少犯“弃真”错误的可能性( ),势必增大犯“纳伪”错误的可能性( ),也就是说, 的大小和显著性水平的大小成相反方向变化。两类错误发生的概率 的相对关系可由下面的图形来表示:图7-2 两类错误从图7-2中,我们也可以看出,当真实分布与待判别分布越远离时,在一定下,将越小;也就是说,当差别比较明显时,我们犯错误的可能性会更小,反之亦然。假设三、检验功效由于为犯“纳伪”错误的可能性大小,或者说 表示出现接受不真实的原假设的结论的概率,那么1- 就是指出现拒绝不真实的原假设的概率。若1- 的数值越接近于1,表明不真实的原假设几乎都能够被拒绝。诚然,

14、如果1- 的数值接近于0,表明犯“纳伪”错误的可能性很大。因此, 1- 可以用来表明所做假设检验工作好坏的一个指标,我们称之为检验功效。它的数值表明我们做出正确决策的概率为1- 。一个好的检验法则总是希望犯两类错误的可能性与都很小,但是这在一般场合下是很难实现的。要使得小,必然导致大,若要使 小,必导致增大。在实际检验中,一般首先控制犯“弃真”错误的概率,也就是事先给出的显著性水平的数值尽量地小,在其它条件不变的情况下,增加犯“纳伪”错误的可能性,即增大,从而使得检验功效(1- )减弱。在此情况下,如何增强检验功效?解决的唯一办法只有增大样本容量,这样既能保证满足取得较小的 ,又能取得较小的值

15、,一举两得。然而实际上样本容量的取得是有限制的,只能根据实际来确定。第二节 总体参数假设检验总体均值的假设检验两个总体均值之差的检验总体成数的假设检验总体均值的假设检验两个正态总体方差比的检验总体参数假设检验就是检验已知分布形式(本节主要考虑正态分布)的总体的某些参数(例如均值或者方差)是否与事先所做的假设存在显著性差异,又称为显著性检验。主要包括对总体均值和总体方差的假设检验。本节分各种情况对这两方面的检验进行介绍。一、总体均值的假设检验总体均值的假设检验就是检验由样本信息所推断的当前总体均值是否与事先假设的总体均值存在显著性差异。设样本X1,X2,Xn来自于正态总体N(,2 ),样本均值为

16、 ,样本的标准差为s2 ,对于均值的检验问题。(一)总体方差2已知对于双侧检验,建立的假设为:H0:=0, H1:0其中 为一个给定已知的常数。对于左(右)单侧检验来说,建立的假设为:H0:=0, H1:<(或>)0可以利用上面介绍过的z检验法,构造检验统计量 (7.1)在原假设成立的条件下,该统计量的分布为:z N(0,1)。从而在给定的显著性水平下,我们可从标准正态分布表中查得临界值 (对应于左、右单侧检验的临界值分别为- z1-和z1-)。根据样本资料及假设,计算出样本统计量的值z。这样,我们便可以得出原假设的拒绝域为: (对双侧检验而言)z<-z1-(对于左单侧检验而

17、言)z>z1-(对于右单侧检验而言)当z值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。(二)总体方差2未知总体方差2未知时对于均值的假设检验,类似上面方差2已知时的做法。对于双侧检验,建立的假设为:H0:=0, H1:0对于左(右)单侧检验来说,建立的假设为: H0:=0, H1:<(或>)0只是在构造检验统计量时,不是利用z检验法。而是在原假设成立的条件下,利用t检验法,构造检验统计量t(n-1)(7.2)其中 为样本标准差。t统计量就是用样本标准差s来代替z统计量中未知的总体标准差。对于临界值,在t分布表中查得临界值 (双侧检验)、 -t1-(n-1) (左单

18、侧检验)、 t1-(n-1) (右单侧检验)。根据样本资料及假设,计算出样本统计量的值t。这样,可以得出对原假设的拒绝域为:样本统计量的值t满足(双侧检验)t<-t1-(n-1)(左单侧检验)t>t1-(n-1)(右单侧检验)当t值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。这里应该注意的是,在实际中不能够确定总体是否满足正态分布,但是样本容量n很大。根据中心极限定理,该总体分布近似服从正态分布,对该总体均值的检验可以依据上面的总体方差未知的程序来进行。对于小样本情况,我们也是根据上面的t检验来进行。【例7-1】为了考察某种类型的电子元件的使用寿命情况,假定该电子元件使用寿命的分

19、布为正态分布。而且根据历史记录得知该分布的参数为:平均使用寿命为100(小时),标准差 =10(小时)。现在随机抽取100个该类型的元件,测得平均寿命为102(小时),给定显著性水平=0.05 ,问该类型的电子元件的使用寿命是否有明显的提高。解:此题为单侧检验,且是右单侧检验。以表示元件的平均使用寿命(小时),则(1)建立假设H0:= 100,即平均使用寿命无明显变化;H1:>100 ,即使用寿命有明显提高。(2)确定检验统计量及其分布 N(0,1)(3)确定临界值右单侧检验的临界值为z 。由于给定的显著性水平=0.05,那么双侧概率水平为20.050.1,则F(z )=1-0.1=0.

20、9,查正态分布表得到z =1.645,即为临界值。(4)计算样本统计量并判断根据样本资料,计算样本统计量:由于计算的样本统计量z>1.645,所以拒绝原假设H0 ,可以认为该类型的电子元件的使用寿命确实有所提高。【例7-2】在上例中,如果抽出的100个样本元件,测得其平均使用寿命为98(小时),其余条件相同,试问该类型元件的使用寿命是否有显著性下降。解:此例为左单侧检验问题。(1)建立的假设检验为H0:=100,无明显变化; H1:<100 ,有显著性下降。(2)确定检验统计量及其分布在原假设成立下,检验统计量为: N(0,1)(3)确定临界值此时左侧临界值为- z,根据上面的结果

21、,得到临界值为-z=-1.645(4)计算样本统计量并做出判断:样本统计量为:由于-z<-1.645 ,所以拒绝原假设H0 ,说明该类型元件的使用寿命有显著性下降。【例7-3】某糖果生产基地,生产的标准是每袋糖果的净重为500(克)。今从一批生产中抽出10袋,实际测得每袋糖果的净重(克)为:512 503 498 507 496 489 499 501 496 506给定显著性水平=0.01,试问该批的生产是否正常。解:该例中,所检验问题是糖果净重是否符合500克的标准,属于双侧检验问题。(1)建立假设H0:=500, H1: 500(2)确定临界值由于是双侧检验,所以应该有两个临界值:

22、上临界值、下临界值。又因总体的标准差未知,需要用样本标准差s来代替,因此,统计量服从的是自由度=n-1的t分布,而非正态分布。此例中n=10, =0.01 ,则自由度=10-1=9 ,查t分布表得到,上临界值t/2()=t0.005(9)=3.25,由于分布的对称性,下临界值为t/2()=t0.005(9)=3.25。(3)计算样本统计量在计算样本统计量之前需要先计算样本均值和样本标准差:样本均值: (克)样本标准差: (克)检验的样本统计量:(4)判断:根据样本计算的统计量t=0.335-3.25,3-25,所以不能拒绝原假设,也即,在99的置信度下,可以认为该批生产正常。【例7-4】承上例

23、,假定所要检验的是该批生产是否显著地高于标准。解:这样检验问题就变为单侧检验了,而且是右单侧问题。(1)建立假设H0:500, H1:>500(2)确定临界值由于是属于单侧检验,所以只有一个临界值;N=10,=0.01,查表得到该临界值为 t ()=t0.01(9)=2.821(3)计算样本统计量跟上例的计算一样,此处略,得到样本统计量t=0.335 (4)判断由于实际的样本统计量t=0.335 <临界值t0.01(9)=2.821 ,所以不能拒绝原假设,可以认为该类生产没有显著地高于标准。该结论与上例的结论相符。二、两个总体均值之差的检验两个总体均值之差的检验,就是对两个不同总体

24、的均值之间的差异性是否显著所进行的检验。为了分析的简化与方便,我们假定x是取自于均值为x 、方差为的正态总体X的一个样本,y是取自于均值为 y 、方差为 的正态总体Y的一个样本,样本容量分别为 ,且假定此两样本相互独立。 、为对应的样本均值与样本方差,显著性水平为。下面我们分总体方差已知和未知两种情况,来分析总体均值的差异显著性检验。(一)两总体方差 已知 双侧检验原假设为H0:x=y,备选假设为 H1:xy根据上面的假定和抽样分布理论,我们可以得到: N(0,1) (7.3)所以在原假设成立下,构造的检验统计量为: N(0,1) (7.4)在显著性水平下,我们查标准正态分布表得到临界值 。将

25、样本资料代入所构造的检验统计量,得到样本统计量z。若 ,则拒绝原假设;反之,则不能拒绝原假设。 左单侧检验原假设为H0:x=y,备选假设为 H1:x<y此时可从标准正态分布表查得的临界值为z1- 。检验的拒绝域为: z<-z1-。 右单侧检验原假设为H0:x=y ,备选假设变为H1:x<y此时的临界值也为z1-。检验的拒绝域为: z>z1- 。(二)两总体方差 未知但相等在两方差未知但相等的情况下,我们根据抽样分布理论知: t(n1+n2-2) (7.5)对于双、单侧检验,原假设都是相同的,均为H0:x=y。只是在双侧检验时,备选假设H1:xy ;在左单侧检验时,备选假

26、设为H1:x<y ;在右单侧检验时,备选假设为H1:x>y 。在原假设成立的情况下,根据上面的公式,我们可以构造如下的检验统计量: t(n1+n2-2) (7.6)可以根据样本资料的数据,计算样本检验统计量的数值。对于双侧检验,可以从t分布表中查得临界值 ,此时原假设的拒绝域为: 。反之就不能拒绝原假设。对于左、右单侧检验,从 分布表中查得临界值t1-(n1+n2-2);左单侧检验拒绝原假设的范围是:t<- t1-(n1+n2-2)。右单侧检验拒绝原假设的范围为:t<- t1-(n1+n2-2)。若t在拒绝域之外,则不能拒绝原假设。【例7-5】将某小学一年级学生随机分为

27、两组,对其中一组运用新型的教学方式,称为新型组,另一组按照传统的教学方式称为传统组。经过六个月后,对该年级学生进行成绩测试。假设两组成绩的总体标准差相同。从新型组抽取31名学生,求得其平均成绩为78.06,标准差为9.36;同样的,从传统组抽取31名,求得的平均成绩为76.30,标准差为10.12。假设两组成绩的总体标准差相同。比较两组学生的平均成绩是否有显著性差异。解:此题属于在两总体方差未知(但是假定两方差相等)下,检验两组均值是否有差异的问题。依题意有,(1)建立假设。H0:x=y,备选假设H1:xy ;(2)构造检验统计量为t (n+n2-2) 其中由于相等的标准差未知,我们用来估计。

28、(3)确定临界值。从t分布表中查得临界值 。(4)计算样本统计量及判断。将样本资料代入检验统计量得到 因而有 ,不能拒绝原假设,即两组的均值没有显著性差异。三、总体成数的假设检验成数是反应现象数量结构的指标。例如就业率、升学率、产品合格率等等。要考察总体成数是否发生显著性变化,可以通过样本成数来对其进行假设检验。与对总体均值的假设检验类似,总体成数的假设检验包括单样本和多样本(本处只考虑两样本情况)总体成数检验。(一)单样本成数检验当样本容量比较大时,按照中心极限定理,分布以正态分布为极限。因而,对总体成数的假设检验可以借助正态分布来进行。建立假设: ,构建的检验统计量为 (7.7)服从标准正

29、态分布,即 z N(0,1)其中,P代表样本的成数,代表总体的成数。, 对于显著性水平 ,可以通过查标准正态分布表,得到临界值 。从样本数据中计算得出 样本成数P代入检验统计量,得到样本统计量 Z。将样本统计量与临界值进行比较,若 ,则拒绝原假设;反之则不能拒绝原假设。当然,如果对应的原假设是单边的,即H0: (或)0,则对应的临界值是z1-。若 ,则拒绝原假设;反之,则不能拒绝原假设。我们以例子来说明单样本成数检验的过程。【例7-6】某牌子的冰箱生产商声明,其产品在该地区的市场占有率为60。为了检验该说法的正确与否,我们在该地区随机调查了100名购买了冰箱的消费者,其中有57人购买的是该牌子

30、的冰箱,试问该生产商的声明是否可靠?(=0.05)解:经分析,本例属于双侧检验。样本市场占有率 (1)建立假设: H0:=60%, H1:60%(2)检验统计量: N(0,1)(3)计算临界值:在5的显著性水平下,从标准正态分布表中可以查得临界值为: (4)计算样本统计量及判断: 样本统计量 ,因而,我们不能拒绝原假设,即生产商的声明是可靠的。(二)两个样本总体成数差的检验如果要考察两个总体的成数之间是否有显著性差异,可以用两样本总体成数差检验。假定对应两总体的样本容量分别为n1、n2,当 n1、n2都比较大时,我们可以构造如下的检验统计量,该检验统计量服从标准正态分布。 N(0,1) (7.

31、8)若建立的原假设为 H0:1=2,相应的临界值为 ;若建立的原假设为H0:1(或)2,则相应的临界值为z1- 。能否拒绝原假设的判断规则如前面所述。【例7-7】考察专业股票分析师和普通股民对整个股票市场走势的判断是否存在显著性差异。在100名的专业股票分析师中,有55的人认为股票市场将上升,在150名普通股民中,有48的持相同观点。试问,专业分析师和普通股民的观点是否存在显著性差异( =0.05)。解:根据题设,已知 。建立原假设 ,备选假设 根据样本资料计算检验统计量的值从标准正态分布表查出=0.05时的临界值为 。因为 ,所以不能拒绝原假设。四、正态总体方差的假设检验方差是反映现象在数量

32、上变异程度的指标,反映变化的均衡程度。对于正态总体方差的检验主要有两种:一是检验总体方差是否显著等于某一给定的确定值;二是检验总体方差是否显著性地在某个给定的范围内。在参数估计中,我们已经知道,可以用样本方差 是总体方差 2的无偏估计。样本方差计算公式中的( n-1)为自由度,说明样本中有(n-1)个样本单位的取值是可以独立确定的,这是由于分子中 的约束使得独立的样本单位少了一个。所建立的原假设为 ,备选假设为 检验统计量为: (7.9)或者是 (7.10)在原假设成立的条件下,该统计量服从自由度为n-1 的 分布,即 (7.11)2 分布曲线全部处于第一象限,其中唯一参数是自由度。当自由度大

33、于30时,分布曲线接近于正态分布。图7-3为 2 分布曲线的演示图。图7-3 2分布图如图中所示,有 。根据显著性水平和自由度n-1,查 2分布表可以得到临界值 。若检验统计量 ,则拒绝原假设;反之不能拒绝原假设。【例7-8】已知生产某型号的螺钉厂,在正常条件下,其螺钉长度服从正态分布 N(4.0,0.04) (单位为厘米)。现在我们对某日生产的螺钉随机抽取6个,测得其长度为4.1,3.6,3.8,4.2,4.1,3.9,试问该日生产的螺钉总体标准差是否正常? (=0.05)解:可以计算出样本标准差 ,该假设检验的过程如下:(1)建立假设: , ;(2)检验统计量: ;(3)临界值:从 2分布

34、表可得到临界值 ;(4)计算样本统计量及其判断。 所以,不能拒绝原假设,可以认为该日生产的螺钉总体标准差正常。五、两个正态总体方差比的检验假定有两个样本,分别为 , ,两样本容量分别为 n1 和n2,且相互独立。其中 分别为两正态分布总体的均值和方差。又 分别为两样本方差,下面分两情况对方差比 进行检验。 (一)两总体均值 x 、y已知在两总体均值已知的情况下,我们用样本方差去估计两总体的方差 。此时样本方差的计算式子如下: 和 式中,两个样本方差的分母(自由度)都为各自的样本容量。根据抽样分布理论知: , ,且统计量 (7.12)即统计量 F服从F 分布。 建立假设: 。对于双侧检验, 。在

35、原假设成立下,检验统计量为: (7.13)根据显著性水平 和自由度,查 F分布表可以得到两个临界值:。若样本统计量 F满足: ,那么就可在 概率水平下拒绝原假设。反之,如果计算的样本统计量值在区域 之中,那么我们就不能拒绝原假设。对于左单侧检验,建立的备选假设为 ,据以判断的临界值为 ,拒绝域为样本统计量 。对于右单侧检验,建立的备选假设为 ,据以判断的临界值为 ,拒绝域为样本统计量 。(二)两样本均值 x 、y未知在两总体均值未知下,我们用如下计算式子的样本方差去估计两总体的方差 : 和 式中, , 分别为两样本平均值,两个样本方差的分母(自由度)都为各自的样本容量减去1。由于 , ,有统计

36、量 (7.14)从而可将其作为检验统计量。 建立的原假设为 ,在原假设成立的情况下,检验统计量 (7.15)对于双侧检验,备选假设为 ,当样本统计量 或 时,拒绝原假设;反之则不能拒绝原假设。 对于左单侧检验,备选假设为 ,据以判断的临界值为 ,拒绝域为样本统计量 。对于右单侧检验,备选假设为 ,据以判断的临界值为 ,拒绝域为样本统计量 。 【例7-9】为了比较两个地区(甲、乙)居民人均月收入不平均的差异,分别在两个地区调查8户和7户的人均月收入为(假设收入都服从正态分布):试问甲区的人均月收入的不均衡性是否不大于乙区的。 解:人均月收入的不均衡性可以用方差(或者是标准差)来表征,因而问题就转

37、化为检验两地区人均月收入方差(标准差)的差异性。从调查的样本资料中,我们可以得到 , , ,(1)建立假设: , (2)检验统计量: (3)临界值:从 分布表中查得临界值为 (4)样本统计量的计算及判断:所以不能拒绝原假设,即不能认为甲区的人均月收入波动较小。第三节 非参数检验非参数检验概述 2检验符号检验等级相关秩和检验游程检验 等级相关一、非参数检验概述前面介绍的各种假设检验都是在总体分布形式已知或者假定总体分布的前提下做出判断。但在实际问题中,可能无法获知或者不一定很了解总体的分布类型,而只能通过样本来检验关于总体分布的假设。这种检验方法称为非参数检验。非参数检验是相对于参数检验而言的,

38、是检验总体分布函数的统计方法。两种检验方法具有共同点:都对总体的某种数量关系、特征做出假设,都建立原假设和备选假设,都是根据实际样本统计量与临界值的比较做出对假设的判断。其区别在于:参数检验需要对总体分布做某些限制性的假定,该假定要求总体的分布类型是已知的,未知的只有分布中的某些参数是否发生变动,而且大多检验是建立在高斯等人的正态分布理论上。如果对总体的分布不了解或者了解很少,那么参数检验的结果会更加不可靠,甚至会发生很大偏差。而非参数检验却不依赖于对总体分布或参数的知识,不对总体分布加以限制性的假定,亦称为自由分布检验。由此可见,非参数检验与传统的参数检验比较有一些优缺点:对检验的限制更少,

39、更加避免先见偏差,具有较好的稳健性;可以在更少样本资料要求的情况下进行,在一定程度上弥补有些实际中样本资料不足等的缺陷;可以弥补上述参数检验中碰到的无法运用的属性资料问题,然而,同时也就可能损失了其中所包含的另外信息。二、 2检验2 检验是利用 2 分布的原理,通过对样本数据进行分析来对样本所属的总体情况进行判断的一种检验方法。在第一节中,我们也用过 2 检验,不过是在了解总体的分布类型的情况下来应用的。本小节中将介绍 2 检验在非参数检验中的应用,包括分布拟合检验和独立性检验。(一)分布拟合检验在实际中,往往并非总是知道所研究总体的分布状况,但却可以得到取自于该总体的样本。那么,就期望根据来

40、自于该总体的样本资料信息去推断、检验总体分布是否与指定分布吻合。该检验的假设为 , 其中 F(x)为总体的分布函数, F0(x)是某个事先假定的总体分布函数。2检验的步骤为:(1)建立假设: , 。(2)将样本资料数据值按区间进行适当的划分:分为 m个区间,各个区间的分界值为 Xi,其中 ,同时应保证各个区间互不相容。(3)计算在各个样本区间内的实际频数 ( ),也即为样本数值落在各个区间的样本个数。当原假设 H0为真时,计算落在各个区间的理论概率值: ,从而计算出各个区间的理论频率数为 npi。其中 n为样本容量。(4)调整区间:由于该检验要求样本容量 n足够大,以及 nPi不能太小。根据经

41、验,一般要求 n50,nPi>5 。如果nPi5,则将nPi5的样本合并。(5)构造并计算统计量:当原假设为真时,样本实际频数fi应该与理论频数nPi接近,即 不应太大。根据K皮尔逊的研究,可以构造如下的检验统计量 (7.12)其中 k为待估计的参数个数。其余符号含义与上述同。(6)计算临界值:在给定显著性水平 下,查2 分布表得到临界值 。这样就得到拒绝原假设的值域: (7)进行判断:如果计算的样本统计量2 确实大于 ,那么就可以拒绝原假设,否则不能拒绝原假设。【例7-10】欲检验某个骰子是否均匀,可以通过检验各个点数的出现是否是随机的。我们随机投出骰子102次,将得到的点数记录下来;

42、出现各个点数的次数见表7-3。解:记各个点数出现的次数为X ,其分布未知,依据题意我们可以对其分布建立假设,即H0:X服从均匀分布,也即 X的分布满足 , ; H1:X不服从均匀分布。在原假设下,各个点数出现的期望频数均为 (次)。根据(7.16)式可以得到:查表得到临界值为 , 因而,我们不能拒绝原假设,可以认为该骰子是均匀的。(二)独立性检验顾名思义,该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。列联表是多行多列纵横交错所形成的一个表体。我们以例子说明列

43、联表的形式以及如何将独立性检验化为列联表并进行检验分析的程序。【例7-11】抽样调查某地区500名待业人员,这些人员中文化程度为高中及以上的有104人(男44人),初中的有96人(男36人),小学及以下的有300人(男140人)。问此调查结果能否说明待业人员中的文化程度与性别是相互独立的。解:根据调查结果,我们可将数据整理成列联表,见表7-4。列联表中,括号内的数值为该处的期望值,其计算方法为:该格子所对应的行合计与列合计的乘积,再除以总合计。例如,性别为男且文化程度为高中及以上所对应的期望值为 ,其它各个格子对应的期望值也如此计算得到。在得出对应的期望值后,就可以应用 2检验。从 2分布表可

44、查到临界值为 ,其中的自由度为 。比较可得到样本 2值小于临界值,所以我们不能否定原假设,也就是待业人员中的文化程度与性别不显著。三、符号检验符号检验是非参数检验中最简单又最常用的方法之一,它既适用于单样本,又适用于配对样本。(一)单样本的符号检验在单样本的情况下,符号检验适用于检验总体中位数是否在某一指定的位置。反映一个总体分布位置的参数主要有均值和中位数。均值反映的是分布数列的重心位置,而中位数则是反映分布数列中上下两边次数相等的中央位置,也就是说在数列中,有一半的数值在此中位数之上,而另一半在中位数之下。当分布为对称时,中位数上下两边的数值的位置是一致的,当分布不对称时,两者就有差异。在

45、偏斜度较大时,检验中位数往往比检验均值更有实际意义。因为均值对离群值的敏感性较大,而中位数相对而言敏感性较小,从而更能客观地反映样本数据的分布情况。中位数检验的基本原理是,假设总体中位数的真值 ,然后在实际抽取的容量为n 的样本中,将每个观测值xi 均减去A ,并只记录其差值的符号,即为 (7.17)若 ,就略去不计。接着分别计算“+”的个数(用 表示)和“”的个数(用 表示)。理论上,当中位数 为真时,得到的正负号个数应该接近相等,即 。若从样本中得到的 和 相差较远,那么就有理由拒绝 。该检验中所用的判别标准是由二项分布临界值提供的,在大样本下,可由正态分布来逼近。下面用例子来说明检验的具

46、体过程。【例7-12】从大学某系男女新生中,随机抽取20名,测得体重数据如下(公斤):给定显著性水平 =0.1,用符号检验判定中位数是否与 有显著性差异。解:(1)建立假设, (2)将各个数据均减去原假设所设定的中位数55 ,并把各个正负号记录下来。如果数据与中位数一致,则略去。得到: n+=9, n-=10 , 因此 n= n+ n-=19(3)计算临界值:由于是双侧检验,检验水平为=0.05 ,查二项分布临界值表,当 n=18时,临界值为13。(4)进行判断:由于 ,所以不能拒绝原假设,即可以认为总体体重的中位数为 55(公斤)。(二)配对样本的符号检验上面的检验是针对单个总体的情况,实际

47、中,有可能要同时对两个总体的分布进行比较。假定X 、Y 分别为从总体 F1(X)、F2(X)中抽取的样本,它们的样本容量均为 ,且两个样本的观测值是一一对应的。建立的假设为H0 :F1(X)=F2(Y),H1 :F1(X) F2(Y) 。在原假设成立的条件下,样本中 Xi大于相对应的 Yi的个数应该与 Xi小于相对应的 Yi的个数大致相等,这些个数满足二项分布。因而,可以利用此特征来进行检验,或者是说,利用此特征来设立检验的统计量。设配对样本 Xi、Yi序列中, Xi>Yi 的个数为 r+,Xi <Yi的个数为 r- , 不考虑 Xi=Yi的个数,所以有r+ r-n 。取r=max(r+,r- ),在显著性水平 下,有 prr()=。临界值 r()是根据二项分布的原理来求得的,也可以从临界值表查得。如果 rr() ,我们就拒绝原假设,否则就不能拒绝原假设。【例7-13】假定在某项比赛中,某两位裁判 (A,B)分别对该项赛事

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!