总体均数的估计与假设检验

上传人:xt****7 文档编号:182069545 上传时间:2023-01-20 格式:PPT 页数:128 大小:1.30MB
收藏 版权申诉 举报 下载
总体均数的估计与假设检验_第1页
第1页 / 共128页
总体均数的估计与假设检验_第2页
第2页 / 共128页
总体均数的估计与假设检验_第3页
第3页 / 共128页
资源描述:

《总体均数的估计与假设检验》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验(128页珍藏版)》请在装配图网上搜索。

1、1第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验Estimation of Population Mean Estimation of Population Mean and Hypothesis Testand Hypothesis Test 2ContentContent1.1.Sampling error and standard error of meanSampling error and standard error of mean2.2.t-distributiont-distribution3.3.Estimation of Population MeanEst

2、imation of Population Mean4.4.t-testt-test5.5.Notice of hypothesis testNotice of hypothesis test 6.6.Normality test and homogeneity of varianceNormality test and homogeneity of variance test test3第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误n统计推断:由样本信息推断总体特征。4样本统计指标样本统计指标(统计量)(统计量)总体统计指标总体统计指标(参数)(参数)正态(分布)总体:正态(分布

3、)总体:推断推断 !说明!说明!为说明抽样误差规律,先用一个实例,后为说明抽样误差规律,先用一个实例,后引出理论。引出理论。2(,)N 5 jjXS 167.41,2.74 165.56,6.57 168.20,5.36 165.69,5.09 nj=10 100 个 =167.7cm =5.3cm X1,X2,X3,Xi,图图3-1 1999年某市年某市18岁男生身高岁男生身高N2)的抽样示意图的抽样示意图 见P3436表3-167 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2

4、从正态分布总体从正态分布总体N2)随机抽样所得样本均数分布随机抽样所得样本均数分布8 ,各样本均数各样本均数 未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本样本均数的分布为中间多,两边少,左右基本对称。对称。样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大大缩小。大缩小。可算得这可算得这100个样本均数的均数为、标准差为。个样本均数的均数为、标准差为。XX 样本均数的抽样分布具有如下样本均数的抽样分布具有如下特点:特点:1、抽样误差:n 由个体变异产生的、抽样造成的样本统计量与总体参数的差

5、别n 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别n 原因:1)抽样n 2)个体差异910同理,在非正态分布总体中也可进行类似的抽样同理,在非正态分布总体中也可进行类似的抽样研究。研究。若若iX服从正态分布服从正态分布 则则 jX服从正态分布服从正态分布 n大:大:则则 jX近似服从正态分布近似服从正态分布 若若iX不服从正态分布不服从正态分布 n小:小:则则 jX为非正态分布为非正态分布 本书以本书以n=60n=60为界限为界限11表示表示样本统计量样本统计量抽样误差大小的统计抽样误差大小的统计指标。指标。均数标准误:均数标准误:说明均数抽样误差的说明均数抽样误差的大小,总体计算公

6、式大小,总体计算公式(3-1)Xn2、标准误标准误(standard error,SE)实质:样本均数的标准差实质:样本均数的标准差XX;XX。12数理统计证明:数理统计证明:13若用样本标准差若用样本标准差S 来估计来估计 ,(3-2)降低抽样误差的途径有降低抽样误差的途径有:通过增加样本含量通过增加样本含量n;通过设计减少通过设计减少S。XSSn14第二节第二节 t 分布分布(t-distribution)nt分布概述n n 抽样误差的分布规律 n n 样本 总体n t分布 理论 n 手段 (桥梁)目的1516 一、一、t 分布分布的概念的概念 172若若样样本本均均数数X服服从从总总体体

7、均均数数为为、总总体体标标准准差差为为X的的正正态态分分布布2(,)XN,则则通通过过同同样样方方式式的的 u 变变换换(XX)也也可可将将其其转转换换为为标标准准正正态态分分布布 N(0,12),即即 u 分分布布。18,1XXXtnSSn 式中式中 为自由度为自由度(degree of freedom,df)3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,代替,则则 不再服从标准正态分布,而不再服从标准正态分布,而服从服从t t 分布。分布。XXS()/XXS19t 分分 布布 是是 一一 簇簇 曲曲 线线。当当 自自 由由 度度不不 同同 时时,曲曲 线线的的 形形 状状 不

8、不 同同。当当 时时,t 分分 布布 趋趋 近近 于于 标标 准准 正正态态 分分 布布,但但 当当 自自 由由 度度较较 小小 时时,与与 标标 准准 正正 态态 分分 布布 差差异异 较较 大大。其其 图图 形形 如如 下下:二、二、t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度t20 t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(标准正态曲线)=5=1f(t)图3-3 不同自由度下的t 分布图21 单峰分布,以单峰分布,以 0 为中心,左右对称;为中心,左右对称;自由度自由度越小,则越小,则 t 值越分散,值越分散,t 分布的峰部分布的

9、峰部越矮而尾部翘得越高;越矮而尾部翘得越高;当当逼近逼近,XS逼近逼近X,t 分布逼近分布逼近 u分布,故标分布,故标准正态分布是准正态分布是 t 分布的特例。分布的特例。1特征:特征:222参数参数(only one):3 t 界 界值表:详见附表值表:详见附表 2,可反映,可反映 t 分布曲下的面积。分布曲下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用,t 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用/2,t表示。表示。2 t界值表:详见附表界值表:详见附表2,可反映,可反映t分布曲分布曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;

10、双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。2参数参数(only one):3t 界界值表:详见附表值表:详见附表 2,可反映,可反映 t 分布曲下的面积。分布曲下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用,t 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用/2,t表示。表示。23-tt024 0.05,10101.812t,单=0.05,则有(1.812)0.05 (1.812)0.05P tP t 或 0.05/2,10102.228t,双=0.05,则有(2.228)(2.228)0.05P tP t 举例举例:25第三节第三节 总体均数的估计总体均数的

11、估计26一、参数估计一、参数估计 用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和用样本均数(和标准差)推断总体均数。标准差)推断总体均数。27 1点估计点估计(point estimation):就是用就是用相应样本统计量直接作为其总体参数的相应样本统计量直接作为其总体参数的估计值。估计值。如用如用X估计估计、S 估计估计等。等。其其方法虽简单,但未考虑抽样误差的大小。方法虽简单,但未考虑抽样误差的大小。28 按预先给定的概率按预先给定的概率(1 )所确定的包含所确定的包含未知总体参数的一个范围。未知总体参数的一个范围。总体均数的区间估计:总体均

12、数的区间估计:按预先给定的按预先给定的概率概率(1 )所确定的包含未知总体均数的一所确定的包含未知总体均数的一个范围。个范围。如给定如给定,该范围称为参数的该范围称为参数的95%可信区间或可信区间或置信区间;置信区间;如给定如给定,该范围称为参数的该范围称为参数的99%可信区间或可信区间或置信区间。置信区间。2区间估计区间估计(interval estimation):29二、总体均数可信区间的计算二、总体均数可信区间的计算 n总体均数可信区间的计算n需考虑:n(1)总体标准差是否已知,n(2)样本含量n的大小n通常有两类方法:n(1)t分布法n (2)u分布法3031 (1)未知:按未知:按

13、 t 分布。分布。双侧双侧1可信区间则为可信区间则为:2,2,60,故可采用正态近似的方法按公式,故可采用正态近似的方法按公式(3-8)计算可信区间。今计算可信区间。今 X=3.64、S=1.20、n=200、XS=0.0849,取双尾取双尾 0.05 得得0.05/21.96u。3.641.960.0849(3.47,3.81)(mmol/L)382.两总体均数之差的可信区间两总体均数之差的可信区间:从从 相相等,但等,但不等的两个正态总体不等的两个正态总体 N(1,2)和和N(2,2)进行随机抽样。则两总体均数之差进行随机抽样。则两总体均数之差(12)的双侧的双侧1可信区间为可信区间为 1

14、212/2,()XXXXtS1212(1)(1)2nnnn3912XXS为两均数之差的标准误由下式计算 1221211()CXXSSnn 222112212(1)(1)2CnSnSSnn 2CS合并方差。4041 例例3-4 为了解氨甲喋呤为了解氨甲喋呤(MTX)对外周血对外周血IL-2水平的影响,某医生将水平的影响,某医生将61名哮喘患者随机分为名哮喘患者随机分为两组。其中对照组两组。其中对照组29例例(),采用安慰剂;实验,采用安慰剂;实验组组32例例(),采用小剂量氨甲喋呤,采用小剂量氨甲喋呤(MTX)进行治进行治疗。测得对照组治疗前疗。测得对照组治疗前IL-2的均数为的均数为20.10

15、 IU/ml(),标准差为,标准差为7.02 IU/ml();试验组;试验组治疗前治疗前IL-2的均数为的均数为16.89 IU/ml(),标准差,标准差为为8.46 IU/ml()。问两组治疗前基线的。问两组治疗前基线的IL-2总总体均数相差有多大?体均数相差有多大?1n2n1X2X2S1S42第一步:第一步:1222(29 1)7.02(32 1)8.4611()2.002329 32 229 32XXS 43第二步第二步:以:以0.05,2932259查查 t 界值表界值表 查附表查附表 2 得,得,0.05/2,602.000t,代入公式,代入公式(3-11),则,则 两总体两总体 I

16、L-2 均数之差均数之差(12)的双侧的双侧 95%可信区间为可信区间为(20.1016.89)2.0002.00230.79,7.21(IU/ml)故两组治疗前基线的故两组治疗前基线的 IL-2 总体均数之差的总体均数之差的 95%可信区间为可信区间为(-0.79,7.21)(IU/mL)。能否下:两组能否下:两组IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结论?的结论?44三、可信区间的确切涵义三、可信区间的确切涵义 n1.95%的可信区间的理解:n(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。n(2)从正态总体中随机抽取100个样本,可算得100个样本

17、均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。n(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。45 n2.可信区间的两个要素n(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。n当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。n(2)精确度:即区间的宽度 n 区间愈窄愈好,如95%的可信区间比99%的可信区间要好。46 n当n确定时,上述两者互相矛盾。n提高准确度(可信度),则精确度降低n(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间

18、要好。n相反,在实际应用中,95%可信区间更为常用。47 n在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。4849四、总体均数可信区间四、总体均数可信区间与参考值范围的区别与参考值范围的区别50*也可用对应于双尾概率时也可用对应于双尾概率时),*也可用对应于也可用对应于双尾概率双尾概率时时)表表3-2 总体均数的可信区间与参考值范围的区别总体均数的可信区间与参考值范围的区别 区别点 总体均数可信区间 参考值范围 含 义 按预先给定的概率,确定的未知参数 的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:当=0.05 时,95%CI 估计正确的概率

19、为 0.95,估计错误的概率小于或等于 0.05,即有 95%的可能性包含了总体均数。“正常人”的解剖,生理,生化某项指标的波动范围。总体均数的可能范围 个体值的波动范围 计算 公式 未知:,XXtS*已知或未知但 n60:XXu或XXu S*正态分布:Xu S*偏态分布:PXP100X 用途 总体均数的区间估计 绝大多数(如 95%)观察对象某项指标的分布范围 51第四节第四节 t 检验检验521 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与

20、与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差别用配对设计。X1X2X01212t t 检验,亦称检验,亦称student student t t 检验检验,有下述情况有下述情况:n对于大样本,也可以近似用u检验。53nt检验和u检验的应用条件:n1.t检验应用条件:n样本含量n较小时(如n60)n(1)正态分布 n(2)方差齐性(homogeneity of variance)n2.u 检验应用条件:n样本含量n较大,或n虽小但总体标准差已知n

21、 (1)正态分布 n (2)方差齐性(homogeneity of variance)5455 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最后获得统计量,最后获得P值来判断值来判断。假设检验基本思想及步骤基本思想及步骤n例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为,标准差为。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值1

22、40g/L?n130.83g/L 140g/Ln原因:1.可能是总体均数不同 n 2.是抽样造成的 56571.建立检验假设,确定检验水准(选用单侧或双侧检验)建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为)无效假设又称零假设,记为 H0;(2)备择假设又称对立假设,记为)备择假设又称对立假设,记为 H1。对于检验假设,须注意:对于检验假设,须注意:检验假设是针对总体而言,而不是针对样本;检验假设是针对总体而言,而不是针对样本;H0和和 H1是相互联系,对立的假设,后面的结论是是相互联系,对立的假设,后面的结论是 根据根据 H0和和 H1作出的,因此两者不是可有

23、可无,而是作出的,因此两者不是可有可无,而是 缺一不可;缺一不可;58 H1的内容直接反映了检验单双侧。若的内容直接反映了检验单双侧。若H1中中只是只是 0 或或 0,则此检验为单侧检验。它不,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守此时应该用单侧检验。

24、一般认为双侧检验较保守和稳妥。和稳妥。59(3)检验水准检验水准,过去称显著性水准,是预,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的先规定的概率值,它确定了小概率事件的标准。在实际工作中常取标准。在实际工作中常取 =。可根据不同可根据不同研究目的给予不同设置。研究目的给予不同设置。60 根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量61 P的含义的含义是指从是指从H0规定的总体随机抽

25、样,抽得规定的总体随机抽样,抽得等于及大于等于及大于(或或/和等于及小于和等于及小于)现有样本获得的检验现有样本获得的检验统计量统计量(如如t、u等等)值的概率。值的概率。例例 3-5 的的 P 值 可 用 图值 可 用 图 3-5 说 明,说 明,P 为 在为 在=0=140g/L的前提条件下随机抽样,其的前提条件下随机抽样,其 t 小于及小于及等于等于-2.138和大于及等于和大于及等于2.138的概率。的概率。3.确定确定P值值62t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0f(t)0.0.1.2.3.4P图图3-5 例例3-5中中P值示意图值示意图63

26、若若P,按所取检验水准,按所取检验水准 ,拒绝,拒绝0H,接受接受1H,下“有差别”的结论。其统计学依,下“有差别”的结论。其统计学依据是,在据是,在0H成立的条件下,得到现有检验结成立的条件下,得到现有检验结果的概率小于果的概率小于,因为小概率事件不可能在,因为小概率事件不可能在一次试验中发生,所以拒绝一次试验中发生,所以拒绝0H。64不能。正确的说法是按所取检验水准不能。正确的说法是按所取检验水准 ,接受,接受1H的统计证据不足。其统计学依据是,在的统计证据不足。其统计学依据是,在1H成立的成立的条件下,如果试验样本少,也同样可以得到条件下,如果试验样本少,也同样可以得到P的的检验结果,我

27、们不知道下“无差别”或“相等”的结检验结果,我们不知道下“无差别”或“相等”的结论犯错误的概率有多大,也就是说,假设检验方法不论犯错误的概率有多大,也就是说,假设检验方法不能为我们提供相信“无差别”结论正确的概率保证。能为我们提供相信“无差别”结论正确的概率保证。若若 ,是否也能下,是否也能下“无差别无差别”或或“相等相等”的结论?的结论?P一、单样本 t 检验 (one sample/group t-test)n 即样本均数 (代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算650,1XXXXtnSSnSnX66 例例3-5

28、某医生测量了某医生测量了36名从事铅作业男性工人的血名从事铅作业男性工人的血红蛋白含量,算得其均数为,标准差为。问从事铅作业红蛋白含量,算得其均数为,标准差为。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值工人的血红蛋白是否不同于正常成年男性平均值140g/L?(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:=0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等蛋白含量与正常成年男性平均值相等H1:0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等蛋白含量与正常成年男性

29、平均值不等 67 本例 n=36,X=130.83g/L,S=25.74g/L,0140g/L。按公式(3-15)130.83 1402.138,36 13525.7436t (2)计算检验统计量计算检验统计量 68以=35、2.1382.138t 查附表 2 的 t 界值表,因0.05/2,35t 2.138 0.02/2,35t,故双尾概率 0.02P0.50。按=0.05 水准,不拒绝 H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。(3)确定确定P值,作出推断结论值,作出推断结论 81 若变量变换后总体方差齐性若变量变换后总体方差齐性 可采用可采用t 检

30、验检验(如两样本几何均数的如两样本几何均数的t 检验,就是将检验,就是将原始数据取对数后进行原始数据取对数后进行t 检验检验);若变量变换后总体方差仍然不齐若变量变换后总体方差仍然不齐 可可采用采用t 检验或检验或Wilcoxon秩和检验。秩和检验。2221若两总体方差不等(),?821211222212121 1nXXtnSSnn12121222,22XXXXStSttSS 2.Cochran&Cox近似近似t 检验(检验(t 检检验)验)调整 t 界值83注意:当 n1=n2=n 时,1=2=,t=t,t=t,=n-1(不是 2n2);用双尾概率时,t为 t/2,12,tt 和取122,2

31、,tt和。84 例例3-8 在上述例在上述例3-7国产四类新药阿卡国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组拜唐苹胶囊的对照组20例病人和用阿卡例病人和用阿卡波糖胶囊的试验组波糖胶囊的试验组20例病人,其例病人,其8周时周时糖化血红蛋白糖化血红蛋白HbA1c(%)下降值下降值如表如表3-5。问用两种不同药物的病人其问用两种不同药物的病人其HbA1c下降下降值是否不同?值是否不同?85分 组 n X S 对照组 20 1.46 1.36 试验组 20 1.13 0.70 表3-5 对照组和试验组HbA1c下降值(%)对照组方差是试验组方

32、差的倍,经方差齐性检验,对照组方差是试验组方差的倍,经方差齐性检验,认为两组的总体方差不等,故采用认为两组的总体方差不等,故采用近似近似 t 检验检验。86(1)建立检验假设,确定检验水准建立检验假设,确定检验水准(略略)(2)计算检验统计量计算检验统计量 22121.46 1.13 0.965,1.360.70202020 119,20 119t 87220.05/2221.360.702.0932.09320202.0931.360.702020t(3)确定确定P值,作出推断结论。值,作出推断结论。查查t界值表界值表t。由由t=0.965t 得得P。按。按 水准,不拒绝水准,不拒绝H0,无

33、统计学意义。,无统计学意义。还不能认为用两种不同药物的病人其还不能认为用两种不同药物的病人其HbA1c下降值不同。下降值不同。881212222122221244222212121212()(),()()1111XXXXSSSSnnttSSSSnnnnnn 3.Satterthwaite近似近似t检验检验:Cochran&Cox法是对临界值校正法是对临界值校正 而而Satterthwaite法法则是对自由度校正。则是对自由度校正。8922222221.360.70()202028.41.360.70(202020 120 1()以28、t查附表2的t界值表得0.20P。结论同前。按按Satte

34、rthwaite法法对例对例3-8做检验,得做检验,得901212222122221244222212121212()(),22()()1111XXXXSSSSnnttSSSSnnnnnn 法近似t检验 Welch法也是对自由度进行校正。校正公式为91对例3-8,如按Welch法,则2222222(1.36 20)(0.7020)229.41.36 20(0.70 2020 120 1()以29、t 查附表2的t界值表得0.20P。结论同前。第五节 假设检验注意事项92一、I型错误和II型错误 n 假设检验是利用小概率反证法思想,根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H

35、0,都可能犯错误。见表3-8。93表3-8 可能发生的两类错误假假设设检检验验的的结结果果 客客观观实实际际 拒拒绝绝 H0“接接受受”H0 H0成成立立 I 型型错错误误()推推断断正正确确(1 )H0不不成成立立 即即 H1成成立立 推推断断正正确确(1 )II 型型错错误误()9495 I I 型错误:型错误:“实际无差别,但下了有差别实际无差别,但下了有差别的结论的结论”,假阳性错误假阳性错误。犯这种错误的概率。犯这种错误的概率是是(其值等于检验水准其值等于检验水准)IIII型错误型错误:“实际有差别,但下了不拒绝实际有差别,但下了不拒绝H H0 0的结论的结论”,假阴性错误假阴性错误

36、。犯这种错误的概率。犯这种错误的概率是是(其值未知其值未知)。但但 n n 一定时,一定时,增大,增大,则减少则减少 。1-1-:检验效能检验效能(powerpower):当当两总体确有差两总体确有差别,按别,按检验水准检验水准 所能发现这种差别的能力。所能发现这种差别的能力。图3-6 I型错误与II型错误示意图(以单侧u检验为例)96 H1:60),则可选用大样本u检验。99n3.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。100n4.结论不能绝对

37、化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成或,而不简单写成,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。101n5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。102 6.可信区间与

38、假设检验各自不同的作用,要结合使用。n 一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。103n 另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。104105 有实际专业意义的值 H0 (2)(3)(4)(5)(1)有实际 可能有实际 无实际 样本例数 可接受 专业意义 专业意义 专业意义 太少 H0 有统计学意义 无统计学意义 图图3-7 可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息 n 虽然可信区间亦可回答假设检验的问题,并能

39、提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。106第六节正态性检验和两样本方差比较的F检验107n t 检验的应用条件是正态总体且方差齐性;配对t 检验则要求每对数据差值的总体为正态总体。n 进行两小样本t检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时。n 若方差齐,采用一般的t 检验;若方差不齐,则采用t检验。108一、正态性检验(normality test)n 1图示法:P-P plot,Q-Q plotn 2矩法n 偏度系数(skewness),n 峰度系数(kur

40、tosis)。n 3 W 检验法n 4 D 检验法109110实际累积概率1.00.75.50.250.00期望累积概率1.00.75.50.250.00图图3-8 例例3-1中中100个样本均数的个样本均数的P-P图图111实际值(实际分位数)174172170168166164162正态期望值(期望分位数)174172170168166164162图图3-9 例例3-1中中100个样本均数的个样本均数的Q-Q图图112113114例例3-9 3-9 试用矩法对表试用矩法对表3-13-1中计算机模拟抽中计算机模拟抽样所得样所得100100个样本均数进行正态性检验。个样本均数进行正态性检验。1

41、15(2)(2)计算检验统计量计算检验统计量231.0,599.021gguu二、两样本方差比较的F检验 两小样本t 检验时,检查两样本方差代表的总体方差是否相等(决定t 检验的方法)。n 1.Levene检验n 2.F检验116211122221()1()nSFnS较 大较 小117118119 f(F)F 0 1 2 3 4 5 0.0 0.2 0.4 0.6 0.8 1.0 1=10,2 1=10,2=1 图图3-10 不同自由度时不同自由度时F分布的图形分布的图形120H0:2221,H1:2221,=0.10 22123.06011.598,2.420520 119,20 119F

42、(2)计算检验统计量计算检验统计量 例例3-10 对例对例3-7,用,用F 检验判断两总检验判断两总体空腹血糖下降值的方差是否不等。体空腹血糖下降值的方差是否不等。(1)建立检验假设,确定检验水准建立检验假设,确定检验水准121以以 1=19、2=19 查查附附表表 3 的的 F 界界值值表表。因因1.5980.10。按按=0.10水水准准,不不拒拒绝绝 H0,无无统统计计学学意意义义。还还不不能能认认为为阿阿卡卡波波糖糖胶胶囊囊组组与与拜拜唐唐苹苹胶胶囊囊组组空空腹腹血血糖糖下下降降值值的的总总体体方方差差不不等等。故故例例3-7采采用用了了方方差差相相等等情情形形的的两两样样本本t检检验验

43、。(3)确定确定P值,作出推断结论值,作出推断结论 122三、变量变换三、变量变换常用的变量变换有对数变换、平方根变换、常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法。性质选择适当的变量变换方法。123124125小结 n1.均数的标准误与标准差的区别126 均数的标准误 标准差 意 义 反映X的抽样误差大小 反映一组数据的离散情况 记 法()XXS()S 计 算 Xn XSSn 2()XN 2()1XXSn 控制方法 增加 n 以标准误 不能通过统计方法来控制 2.两均数差别检验的比较:两均数差别检验的比较:大样本也可近似用u检验3.假设检验的步骤及有关概念n(1)基本思想:“小概率事件在一次抽样试验中几乎是不可能发生”的原理。n(2)步骤:三部曲n(3)类错误、类错误n(4)检验效能(1-)128

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!