卫生统计学分类变量的检验学习教案

上传人:莉**** 文档编号:98817586 上传时间:2022-05-30 格式:PPTX 页数:56 大小:856.67KB
收藏 版权申诉 举报 下载
卫生统计学分类变量的检验学习教案_第1页
第1页 / 共56页
卫生统计学分类变量的检验学习教案_第2页
第2页 / 共56页
卫生统计学分类变量的检验学习教案_第3页
第3页 / 共56页
资源描述:

《卫生统计学分类变量的检验学习教案》由会员分享,可在线阅读,更多相关《卫生统计学分类变量的检验学习教案(56页珍藏版)》请在装配图网上搜索。

1、会计学1卫生统计学分类卫生统计学分类(fn li)变量的检验变量的检验第一页,共56页。第1页/共55页第二页,共56页。目录(ml)第一节 检验的基本(jbn)思想第二节 率的比较(bjio)第三节 独立性检验第四节 拟合优度检验第五节 确切概率法01020304052第2页/共55页第三页,共56页。重点难点 独立样本(yngbn)列联表资料的 检验 配对设计资料的 检验 四格表的Fisher确切概率法22第3页/共55页第四页,共56页。2第4页/共55页第五页,共56页。1. 检验的基本(jbn)思想 (一) 统计(tngj)量222例1 为比较不同大骨节病区的大骨节病检出情况,分别随

2、机抽取河水饮用区377人,泉水饮用区301人,采用X光拍片进行大骨节病诊断。结果见表9-1。现检验两个病区的大骨节病检出率是否不同? 不同病区的大骨节病检出情况地区检出未检出合计检出率(%)河水饮用区 7530237719.89泉水饮用区 9920230132.89合计17450467825.66第5页/共55页第六页,共56页。 其中, Aij (i,j =1,2)为实际频数(pn sh),Tij (i,j =1,2)为理论频数(pn sh) 2独立样本数据(shj)22交叉表 组别属性合计属性1属性2甲A11 (T11)A12 (T12)nR1乙A21 (T21)A22 (T22)nR1合

3、计nC1nC1n第6页/共55页第七页,共56页。22. 理论(lln)频数111111377 174()=96.75678RCRCn nnTnnn121122377504()=280.25678RCRCn nnTnnn212211301 174()=77.25678RCRCnnnTnnn222222301 504()=223.75678RCRCnnnTnnn 四格表中所有格子Aij 的Tij 和之间的差异,可用式(9-1)计算的统计(tngj)量来衡量: 可以证明, 成立时,统计(tngj)量 服从自由度为 的分布。自由度的计算公式为: 。上面公式可简化为: 222211()(1, 2;1,

4、 2)ijijijijATijT ATT2220H1(1) ()行数-列数-1第7页/共55页第八页,共56页。1. 分布 分布是一种连续型随机变量的概率分布,自由度 是其唯一(wi y)参数,记为 。 4种自由度 分布的概率密度曲线 (二) 分布(fnb)的性质22222( )2第8页/共55页第九页,共56页。2. 分布的性质(xngzh) (1) 分布也可看作一种特殊的抽样分布。 (2) 分布是一簇连续光滑曲线,不同自由度的 曲线形状各有不同。各种自由度取值下 分布右侧尾部面积(概率)为 时的临界值记为 ,列于 界值表。当 =1时, 。 22222. 20.05,1=3.84222第9页

5、/共55页第十页,共56页。 (3) 分布的期望值(均值)为自由度 ,方差为 。随着自由度 的增大, 分布将随均值的增大向数轴右侧延伸,而分布曲线也将随方差 的增大越趋低阔。 (4) 检验的基本思想实质是将对两个(lin )或多个总体率(构成比)的比较转化为实际频数与理论频数吻合程度的比较。 222222第10页/共55页第十一页,共56页。第11页/共55页第十二页,共56页。结合例1,四格表 检验基本步骤为: (1)建立检验假设,确定检验水准 ,即河水饮用区和泉水饮用区大骨节病的总体检出率相同(xin tn) ,即河水 饮用区和泉水饮用区大骨节病的总体检出率不同 = 0.05 (一) 22

6、交叉表数据(shj)的 检验22012:H112:H第12页/共55页第十三页,共56页。(2) 检验统计量的选择与计算 (3)确定(qudng) P 值,作出统计推断 =。本例 =14.823.84,即P0.05。在 =0.05水平上拒绝 ,接受 。可以认为两个病区大骨节病的检出率之间差别具有统计学意义,且泉水饮用区的检出率较高。222222(7596.75)(302280.25)(9977.25)(202223.75)14.8296.75280.2577.25223.75ATT20.05,120H1H第13页/共55页第十四页,共56页。 检验适用条件: (1)若n 40,且任意一个格子的

7、理论频数Tij 5,可直接使用 检验公式。 (2)若n 40,但出现1个格子的理论频数1 Tij 5时,则需对值按以下公式进行(jnxng)连续性校正。 (3)若n 40或者任意一个格子的理论频数Tij ,则P,在 水 平上拒绝 ,接受 ,可以认为三组脂肪变性(binxng)的发生率不全相同。 2211()=2.53RCijijijijATT20.05,2220.05,20:H1H1:H0H第19页/共55页第二十页,共56页。 3. 分割 多个率或多个频率分布比较的 检验,当结论为拒绝 时,仅表示多组之间是有差别的。若需明确究竟是哪两组之间存在差别,可做率的多重比较,将RC表分割为若干个小的

8、四格表进行检验。但在具体分割过程中,需根据比较的次数合理地修正检验水准,否则将人为地增大犯第类错误(cuw)的概率。 如:原有检验水准,若进行组数 k 为 3 的两两比较,需比较 =3次,故调整后的水准 ;若设置一个共用对照进行3组比较,则只需(k1)= 2次,调整后的水准 。223C20H第20页/共55页第二十一页,共56页。 现将例3中的DON组设置(shzh)为共用对照,以下表为例介绍 分割的过程。结果如下: 1. NOC组和DON组比较 2DON组和NOC组致小鼠肝脏组织组织大片脂肪变性(binxng)比较第21页/共55页第二十二页,共56页。(1)建立检验假设,确定检验水准 ,即

9、DON组和NOC组肝脏(gnzng)脂肪变性发生率相同 ,即DON组和NOC组肝脏(gnzng)脂肪变性发生率不同 (2)检验统计量的选择与计算(3)确定 P 值,作出统计推断 自由度 =(2-1)(2-1)=1, ,则P ,在水平上不拒绝 ,尚不能认为DON组和NOC组脂肪变性的检出率不同。2112222222(7 8.00)(9 8.00)(24 23.00)(22 23.00)+0.348.008.0023.0023.00A TT20.025,120:H1:H0H第22页/共55页第二十三页,共56页。2. (NOC+DON)组与DON组进行(jnxng)比较 DON组和(NOC+DON

10、)组致小鼠肝脏组织组织大片脂肪变性比较第23页/共55页第二十四页,共56页。(1)建立检验假设,确定检验水准 ,即DON组和(NOC+DON)组肝脏脂肪变性发生率相同 ,即DON组和(NOC+DON)组肝脏脂肪变性发生率不同 (2) 检验统计量的选择与计算(3)确定 P 值,作出统计推断 自由度 =(2-1)(2-1)=1, ,则P,水平上拒绝(jju) ,接受 ,即可认为DON组和(NOC+DON)组脂肪变性的检出率不同。2112222222(7 13.78)(24 17.22)(21 14.22)(11 17.78)+11.8213.7817.2214.2217.78A TT20.025

11、,121:H0H1H0:H第24页/共55页第二十五页,共56页。(三)配对设计数据的 检验 1. 配对四格表 检验例4 为比较间接酶联免疫法和双抗原夹心酶联免疫法对丙肝病毒(HCV)抗原的诊断性能,某检验室将135名血清样本一分为二,分别(fnbi)进行两种试剂盒检测,结果见下表。现比较两种检测方法的结果是否不同? 间接法和夹心法检测结果22第25页/共55页第二十六页,共56页。配对四格表的通用表格如表所示 配对四格表的一般格式 表中的实际频数分别(fnbi)为: a=80为两种检测方法均阳性的对子数,d=10为两种检测方法均阴性的对子数,很显然,a 与 d 都不能反映两种检验方法的差别。

12、而 b=15 和 c=30 则是两种检测方法检验结果不一致的对子数,故两种方法的检测结果有无差别就体现在 b 和 c 这两个对子数。第26页/共55页第二十七页,共56页。 变量 1 的阳性率 ;变量 2 的阳性率 。 变量 1 的阳性率 - 变量 2 的阳性率 ,同样提示两个变量阳性率的比较只和 b、c 有关,而与 a、d 无关。 在原假设 成立的条件下,b 与 c 两个格子理论频数都应该(ynggi)为 (b+c)/2。当 时,可进行简单推导: 类似地,若 ,则需对式(9-6)进行连续性校正。校正公式为nn1nbanm1ncanba 40cb22222()()()()2222bcbcbcA

13、TbcbcbcTbc 40bccbcb22) 1|(|0H第27页/共55页第二十八页,共56页。结合例4,简述配对四格表检验的过程: (1)建立检验假设,确定检验水准(shuzhn) ,即两种检验方法的阳性率相同 ,即两种检验方法的阳性率不同21120:H1:H (2)检验统计(tngj)量的选择与计算 由于b + c = 15 + 30 = 45 40,按式(9-6)求出 (3)确定 P 值,作出统计(tngj)推断 自由度 =1,查 界值表, ,则P 。在水平上,拒绝 ,接受 ,认为两种检测方法的阳性率有差别,且间接法阳性率高于夹心法阳性率。222()(15-30)515+30bcbc2

14、0.05,1220H1H第28页/共55页第二十九页,共56页。2. 配对RR交叉表数据的检验 实际工作中,不少分类变量都具有R(R2)个可能的“取值”,则构成更泛化的配对RR交叉表。这类研究通常需解决的问题为,两个样本分布所对应的总体概率分布是否相同,即类似(li s)于配对四格表 检验的基本原理,对配对设计下两总体分布进行推断,应采用的检验统计量为: 成立时上式中的统计量T服从自由度为 k-1 的 分布221()12kiiiiiiinmkTknmA20H第29页/共55页第三十页,共56页。第30页/共55页第三十一页,共56页。例5 为分析肥胖与糖尿病是否有关,随机调查某社区678名居民

15、,询问其病史,并对其进行体检,收集糖尿病及肥胖情况,结果整理(zhngl)如下表。现分析肥胖与患糖尿病之间是否存在关联性。(一)22交叉(jioch)表的独立性检验肥胖与糖尿病检出情况的分布第31页/共55页第三十二页,共56页。 (1)建立检验假设,确定检验水准 患糖尿病与是否肥胖之间互相独立(dl) 患糖尿病与是否肥胖之间存在关联 (2)检验统计量的选择与计算 ,(3)确定 P 值,作出统计推断 ,P,拒绝 ,接受 ,认为肥胖与糖尿病患病之间存在关联。22,()14.82ijiji jijATT 11212220.05,13.840:H1:H0H1H第32页/共55页第三十三页,共56页。

16、(4)关联系数的计算 本例的关联系数为: 分类变量的关联性分析(fnx)与率(或构成比)的差异性分析(fnx)这两大类着本质的区别。前者主要针对同一随机样本的两个不同属性变量所形成的交叉表,侧重于推断两个不同属性变量之间存在关联性与否;而后者主要针对两个或多个独立随机样本所形成的交叉表,侧重于推断其分别所代表的总体率(或构成比)之间是否存在差异性。2214.8214.820.15678rn第33页/共55页第三十四页,共56页。例6 某医院甲乙两位检验师对同一批血液(xuy)标本的病毒抗原进行检测,检测结果整理如表。两位检验师的检测结果是否存在关联?(二)22配对数据(shj)的独立性检验第3

17、4页/共55页第三十五页,共56页。(1)建立检验假设, 确定检验水准 两位检测师的结果之间互相独立 两位检测师的结果之间互相关联(2)检验统计量的选择与计算 (3)确定 P 值,作出统计推断 P,拒绝 ,接受 。认为(rnwi)两种检测方法之间存在关联性。(4)计算列联系数22,()11.403.84ijiji jijATT(2 1) (2 1)12211.400.2811.40 131rn0:H1:H0H1H第35页/共55页第三十六页,共56页。示例数据见例3,现比较不同毒害作用与小鼠肝脏脂肪变性的关联性。 (1)建立检验假设, 确定(qudng)检验水准 NOC与DOC的作用与肝脏脂肪

18、变性无关 NOC与DOC的作用与肝脏脂肪变性有关 (2)检验统计量的选择与计算 ,(三)RC交叉(jioch)表的独立性检验22,()14.29ijiji jijATT(2 1) (3 1)2v 0:H1:H第36页/共55页第三十七页,共56页。 (3)确定 P 值,作出统计(tngj)推断 , P 0.05,拒绝 ,接受 ,说明不同毒害作用与肝脏脂肪变性之间存在关联。2214.290.3614.2994rn220.05,25.990H1H第37页/共55页第三十八页,共56页。第38页/共55页第三十九页,共56页。例7 随机抽取某医院(yyun)恶性肿瘤患者199名,询问其年龄如下: 6

19、5,68,56,82,65,41,61,44,78,53,64,69,62,57,70,74,59,61,59,66,68,56,52,56,77,74,61,62,57,59,74,62,69,67,69,56,45,44,58,89,60,66,76,40,46,58,55,66,56,61,71,49,62,46,64,61,38,74,57,70,48,42,68,68,59,75,44,64,42,59,60,52,52,41,85,61,52,48,48,80,66,80,80,51,41,67,55,56,75,63,74,61,69,76,38,66,57,63,55,56,4

20、1,79,58,41,66,28,66,83,43,69,63,31,51,52,80,60,49,48,36,75,87,43,79,63,52,70,73,66,56,76,59,59,64,51,65,55,33,63,81,66,69,56,73,38,32,66,44,43,73,44,66,62,62,61,36,42,75,74,73,47,72,69,72,39,65,44,82,49,63,77,66,64,49,67,67,81,57,61,58,61,57,67,66,73,53,58,78,77,51,43,55,65,67,61,81,61,76,76,522第39页

21、/共55页第四十页,共56页。(1)计算样本统计量 获得199名患者年龄的基本信息: , 将样本均数 和样本标准差 作为总体参数 和 的近似值。(2)建立假设检验,确定检验水准 总体分布(fnb)服从 N(60.69, 12.492) 总体分布(fnb)不服从 N(60.69, 12.492) xxS现采用拟合优度检验,判断(pndun)恶性肿瘤患者的年龄分布是否服从正态分布? S0:H1:H第40页/共55页第四十一页,共56页。(3)检验统计量的选择与计算 假设是来自总体的一个随机抽取的样本,共199个样本观测值(n =199)。 计算全距 R,确定拟分组数。本例 R=89-28=61(岁

22、),分为 5 组,组距m=61/5=12.212。 计算样本观测值落在各组段的实际(shj)频数。本例 k=5, 。51199kkA第41页/共55页第四十二页,共56页。(4)计算样本值落在第 i 组段的概率。 正态分布下各组段的概率值: 通过对 和 作标准正态变换后,查标准正态分布界值表获得相应的概率值 Pi 。(5)计算各组对应(duyng)的理论频数(6)计算 值irrrPP() P() P()1,2, ,iiiiu ululX uZZikLiPiTn222()2.71iiiATxT21251skiuiliu第42页/共55页第四十三页,共56页。(7)确定 P 值,作出统计推断 ,

23、,P。在水平上不拒绝 ,则该样本的总体分布服从均数为,标准差的正态分布。 某医院(yyun)199名恶性肿瘤患者年龄频率分布2=2.715.9920.05,2=5.990H第43页/共55页第四十四页,共56页。注意: 拟合优度检验要求足够的样本含量。若样本含量不够大(如:频数表有1/5以下组的理论频数1T5),可以通过连续性校正的检验公式进行统计量的估算。若样本量仍然很小,可人为进行适当(shdng)的合并。 第44页/共55页第四十五页,共56页。第45页/共55页第四十六页,共56页。1. Fisher确切概率法基本思想 保持周边合计数不变,计算交叉表中各个实际频数(pn sh)变动的所

24、有可能组合所对应的概率,再将获得现有样本的概率以及比它更极端的所有概率求和,直接求出单侧或双侧的累计概率进行推断。2. 当22交叉表出现以下情况之一时,需采用Fisher确切概率法 (1)样本含量 n40。 (2)有一个格子的理论频数(pn sh) T1。 (3)检验后所得概率 P 接近检验水准。(一)22交叉(jioch)表的确切概率法第46页/共55页第四十七页,共56页。例8 陕西省为地方性氟中毒病区之一,为了解(lioji)陕西省病区内不同区县儿童氟斑牙发病率是否存在差异,分别抽取镇巴县(以下简称 A 县)和紫阳县(以下简称 B县)812 岁儿童17 和 14 名,并进行儿童牙齿的检查

25、,检查结果如下。现比较两县812岁儿童氟斑牙检出率是否存在差异。 本例 n=3140,不宜采用第 2 节的独立样本率检验,故采用 22 交叉表的Fisher确切概率法。第47页/共55页第四十八页,共56页。(1)建立检验假设, 确定检验水准 ,即镇巴县和紫阳县儿童氟斑牙的检出率相同 ,即镇巴县和紫阳县儿童氟斑牙的检出率不同 (2)计算所有可能组合的概率 Pi 本例中,周边合计最小值为 6,则在四格表边缘合计固定不变的条件(tiojin)下,4 格表内实际频数变动的组合数 i=6+1=7。 i!P! ! ! ! !abcdacbda b c d n12210:H1:H第48页/共55页第四十九

26、页,共56页。第49页/共55页第五十页,共56页。(3)将现有样本的概率以及比它更极端的所有概率求和,直接求出单侧或双侧的累计概率,做出推断(tudun)。 本示例的目的在于比较两县儿童氟斑牙检出率是否相同,故可选择双侧检验。将表中 PA-PB 0.1681,共 5 个四格表的概率 P 值相加: P = P1+ P2+ P3+ P6+ P7 获得累计概率 P = 0.36970.05。故在 =0.05 的水平上不拒绝 ,尚不能认为两县儿童氟斑牙的检出率不同。0H第50页/共55页第五十一页,共56页。 多个样本率或多个频率的分布比较(bjio) 检验中,一般要求其理论频数不能过小,不能有1/

27、5以上格子的理论频数1T5,也不允许有一个格子的理论频数T1,否则结果容易产生偏性。如果实际工作中,确实避免不了上述情况,则可增大样本量,以达到 检验的应用条件;亦可采用 Fisher 确切概率法,但手工计算量巨大且繁琐,一般通过软件计算实现。(二)RC交叉(jioch)表的确切概率法22第51页/共55页第五十二页,共56页。小结(xioji) 1. 检验是一种用途广泛的假设检验方法。 2. 分布是描述连续型变量的一种较为特殊的概率分布。一般地, 检验的基本条件为:n 40 且任一格子的理论频数 T 5;若该条件不满足,则需考虑进行连续性校正(jiozhng)或采用另外的检验方法。 3. 检

28、验的本质在于衡量实际频数 A 和理论频数 T 之间的吻合程度。A 与 T 的吻合程度越高, 值越小,越有理由不拒绝 ;反之,A 与 T 的吻合程度越低, 值越大,越有理由拒绝 。2222220H0H第52页/共55页第五十三页,共56页。4. 统计量的常用计算公式有: 检验基本公式: 配对四格表基本公式: 配对四格表连续性校正公式: 自由度计算公式: ,其中四格表的 。5. 对于多个率或构成比比较的 交叉表 检验,当其结论(jiln)为拒绝 时,仅表示多组之间至少有两组的总体率或频率分布不同,但并不意味着任意两组之间均有差别。若需明确究竟是哪两组之间存在差别,可做率的多重比较,即进行分割。22

29、221()kiiiiATT22()bcbc22(| 1)bcbc() ()11 行数列数RC2=10H第53页/共55页第五十四页,共56页。6 交叉表一般可以分为以下三类: (1)双向无序:即交叉表横、纵标目均为无序的分类变量,可直接使用 检验对总体率或构成比进行分析。 (2)单项有序:一种见于组别分类有序而观察指标无序的列联表,此时可直接采用 交叉表 检验。另一种见于组别分类无序而观察指标有序的交叉表,此时应采用非参数检验比较不同治疗方式的疗效差异。 (3)双向有序:分为双向有序属性相同的交叉表与双向有序属性不同的交叉表两种。此时,需根据(gnj)变量属性与研究目的,选择以下几种方法处理: 检验、基于秩次的非参数检验、Spearman等级相关、Kappa一致性检验、趋势性检验等。R CR C222第54页/共55页第五十五页,共56页。NoImage内容(nirng)总结会计学。DON组和NOC组致小鼠肝脏组织组织大片脂肪变性比较。2. (NOC+DON)组与DON组进行比较。,即DON组和(NOC+DON)组肝脏脂肪变性发生率相同。,即DON组和(NOC+DON)组肝脏脂肪变性发生率不同。间接法和夹心法检测结果。2. 配对RR交叉表数据的检验。此时应采用非参数检验比较不同治疗方式(fngsh)的疗效差异第五十六页,共56页。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!