χ2检验与关联性检验

上传人:xins****2008 文档编号:126939928 上传时间:2022-07-29 格式:PPTX 页数:31 大小:418.86KB
收藏 版权申诉 举报 下载
χ2检验与关联性检验_第1页
第1页 / 共31页
χ2检验与关联性检验_第2页
第2页 / 共31页
χ2检验与关联性检验_第3页
第3页 / 共31页
资源描述:

《χ2检验与关联性检验》由会员分享,可在线阅读,更多相关《χ2检验与关联性检验(31页珍藏版)》请在装配图网上搜索。

1、本资料来源本资料来源第五章第五章 2 2检验检验2 2检验的用途检验的用途1.推断两个或多个总体率或总体构成比之间有无差别2.推断两个变量或两种属性之间有无关联性3.频数分布的拟合优度检验。第五章第五章 2 2检验检验n第一节 四格表资料的 2 检验n第二节 行列表资料的2检验n第三节 分类资料的关联性检验n第四节 频数分布拟合优度的检验第一节第一节 四格表资料的四格表资料的22检验检验n一、2 检验的基本思想n例例5-1 在某项治疗胃溃疡患者的双盲临床试验研究中,将165例患者随机分为两组,A药组85人,有效人数为62人;B药组80人,有效人数48人。问两种药有效率是否有差别?问两种药有效率

2、是否有差别?表5-1 两种药物治疗胃溃疡有效率的比较 处处 理理有有 效效无无 效效合合 计计有效率有效率%A药药62(56.67)a23(28.33)b 85(a+b)72.9B药药 48(53.33)c32(26.67)d80(c+d)60合计合计110(a+c)55(b+d)165(n)66.71 1、(普通)四格表、(普通)四格表n本例表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料四格表资料。n四格表资料的基本形式 2、2 检验的基本公式n要比较两样本率的差异,先假设A、B两种药的有效率相同,均等于合计有效率:110/165=0.6667n理论上药有效人数为:85

3、*110/165=56.7,n同理无效率为:55/165=0.3333n理论上药无效人数为:85*55/165=28.33处处 理理有有 效效无无 效效合合 计计有效率有效率%A药药62(56.67)a23(28.33)b 85(a+b)72.94B药药合计合计48(53.33)c32(26.67)d80(c+d)60.00110(a+c)55(b+d)165(n)66.67同样可以算出B药理论上的有效人数。均在表中列出 上述计算理论上述计算理论数的公式可用数的公式可用右式表示右式表示 RCR CnnTnnTRC 为第为第R 行行C 列的理论频数列的理论频数n nR 为相应的行合计为相应的行合

4、计n nC 为相应的列合计为相应的列合计2、2 检验的基本公式n要比较A、B两药有效率有无差异,可以比较表5-1中每个格子的实际数与理论数的差异;n由于此值又受到实际观察例数多少的影响,由此得到检验统计量:22(),()(1)A TT行数-1 列数nA:实际频数(实际数)实际频数(实际数):实际观察或抽样所得nT:理论频数(理论数)理论频数(理论数):根据某种假设计算所得 3、2 检验的基本思想n检验统计量2 值反映了实际频数与理论频数的吻合程度。n若假设H0:P1=P2成立,四个格子的实际频数A与理论频数T 相差不应该很大,即统计量2 不应该很大。n如果2值很大,则反过来推断A 与T 相差太

5、大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即P1P2。n 由公式还可以看出:值的大小还取决于格子数的多少(严格地说是自由度的大小)。由于各 皆是正值,故自由度愈大,值也会愈大;所以只有考虑了自由度的影响,值才能正确地反映实际频数A和理论频数T 的吻合程度。22()A TT2222()A TT4、2检验的自由度n22检验的自由度取决于可以自由取值的格子数目,而不是样本含量n n。)1C)(1R(n四格表为2行2列,故自由度为 n式中,n:自由度;R:行数;C:列数。(2 1)(2 1)1处理组处理组发生数发生数未发生未发生数数合计合计甲甲aba+b乙乙

6、cdc+d合合 计计a+cb+dnn四格表资料只有两行两列,在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值,即=1。二、完全随机设计四格表资料的检验二、完全随机设计四格表资料的检验 1、设计:成组设计2、目的:推断两样本率p1与p2所代 表的两总体率是否相等即是否P1=P2?(即成组设计的两样本率的比较)3、假设检验步骤n(1)(1)建立检验假设,确定检验水平 H0:P1=P2 即两种药治疗胃溃疡的总体有效率相等 H1:P1 P2 即两种药治疗胃溃疡的总体有效率不等 =0.05n(2)求检验统计量值22222(6256.67)(2328.33)(4853.33)(3226.67

7、)3.1056.6728.3353.3326.671)12)(12(n(3)确定P值,做出推断结论 n根据自由度1,查界值表得 。按a=0.05水准,不拒绝H0,无统计学意义(指和的差别),尚不能认为两药治疗胃溃疡患者的疗效不同。0.050.10P4、四格表资料2 检验的条件n1 1、当、当n n4040,且所有,且所有T5T5时,用基本公式时,用基本公式 TTAx2222()()()()()adbcnab cd ac bdn2 2、当、当n n4040,但有,但有1T1T5 5时,用校正公式时,用校正公式 TTAxc225.022(|/2)()()()()cadbcnnab cd ac bd

8、n3 3、当、当n n4040或有或有T T1 1时,用确切概率法时,用确切概率法(略略)abcd()!()!()!()!abcdacbdPa b c d n实例实例n例例 2-5 2-5 某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎。后随机抽取1515名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人皮肤炎患病情况,资料见表。n问两组的患病率有无差别?问两组的患病率有无差别?防护服防护服 种类种类皮肤炎症皮肤炎症合计合计患病率患病率(%)阳性例数阳性例数阴性例数阴性例数新新 1(3.84)14(11.16)15 6.7旧旧10(7.16)18(20.84)28 3

9、5.7合计合计 11 32 43 25.6n本例n40,因第一行第一列对应的合计数最小,故最小理论数为T11=1511/43=3.845,因而要用校正2检验。94.2.16.11)5.016.1114(84.3)5.084.31(222 Cx05.0,84.321,05.02PxxC33.4.16.11)16.1614(84.3)84.31(222 x05.0,84.321,05.02Pxx 1(3.84)14(11.16)10(7.16)18(20.84)5、四格表专用公式 等等价价)(与与TTAx222221 1814 10434.331528 11 32adbcnxabcdacbd243

10、22221 181410432.9415281132ncadbcnxabcdacbd 等等价价)(与与TTAxc225.0 1(3.84)14(11.16)10(7.16)18(20.84)6、四格表2 检验与U(z)检验的联系n两样本率比较的资料,同一资料即符合2检验条件,又符合U(z)检验条件时,两者均可用,且完全等价。n对同一份资料有:22zx 1、设计、设计:配对设计配对设计 2、目的、目的:推断配对设计的两样本率推断配对设计的两样本率p1与与p2所所代表的两总体率是否代表的两总体率是否 相等即是否相等即是否P1=P2?(即配对设计的两样本率的比较)(即配对设计的两样本率的比较)三、配

11、对设计四格表资料的x2检验(自学)例例 某实验室分别用乳胶凝集法和免疫荧光法对58名系统红斑狼疮患者血清中抗核抗体进行测定,结果见下表。问两种方法的检测结果有无差别?问两种方法的检测结果有无差别?两种检测方法皆为阳性数两种检测方法皆为阳性数(a=11);两种检测方法皆为阴性数两种检测方法皆为阴性数(d=33);免疫荧光法为阳性,乳胶凝集法为阴性数免疫荧光法为阳性,乳胶凝集法为阴性数(b=12);乳胶凝集法为阳性,免疫荧光法为阴性数乳胶凝集法为阳性,免疫荧光法为阴性数(c=2)。免疫荧光法乳胶凝集法合计11(a)12(b)232(c)33(d)35合计134558 上述配对设计实验中,就每个患者

12、而言,两法检测的结果不外乎有四种可能:表表 两相关样本率资料的四格表形式两相关样本率资料的四格表形式甲处理甲处理乙处理乙处理合计合计+-+aba+b-cdc+d合计合计a+cb+dn 两种方法的差别由b、c两格数据来反映,a、d两格表示两法结果相同,不予考虑。因为:1100%abpn免疫荧光法阳性率2100%acpn乳胶凝集法阳性率3、分析分析 4、检验、检验 公式公式 假设两法总体阳性检出率无差别,即总体B=C=(b+c)/2B=C=(b+c)/2 则224 0()1)bcbcbc(22(1)1)4 0bcbbcc(5、检验步骤检验步骤 H0:两法总体阳性率相同,即:两法总体阳性率相同,即总

13、体总体B=C H1:两法总体阳性率不同,即:两法总体阳性率不同,即总体总体BC 本例本例b+c=12+2=1440,故,故 179.521212121222 cbcb查查 界值表,得界值表,得0.010.01P P0.0250.025,按,按0.050.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,故可认为,故可认为两法的阳性检出率不两法的阳性检出率不同。同。2x第二节 行列表资料的2检验目的:目的:可用于可用于多个样本率或构成比的比较多个样本率或构成比的比较设计:设计:nRC表资料检验的专用公式为 n它同样适用于四格表资料,且与基本公式等价。22(1)RCAnn nn 多个样

14、本率比较时,有R行2列,称为R 2表;n 两个样本的构成比比较时,有2行C列,称2C表;n 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R C 表。一、多个样本率的比较n例例5-35-3 某省观察三个地区的花生污染黄曲霉毒素B1情况如下,n问三个地区花生污染黄曲霉毒素问三个地区花生污染黄曲霉毒素B B1 1污染率有无差别?污染率有无差别?地区地区检验的样品数检验的样品数合计合计污染率污染率(%)污染污染未污染未污染甲23 62979.3乙14 304431.8丙 3(5.24)8 1127.3合计 40 4484 47.6 某省三个地区花生黄曲霉毒素某省三个地区花生黄曲

15、霉毒素B B1 1污染率比较污染率比较实例实例n H0:三个地区花生污染黄曲霉毒素B1污染率相等n H1:三个地区花生污染黄曲霉毒素B1污染率不全相等 2)12)(13(n 查界值表,得P0.005,按=0.05水准拒绝H0,接受H1。n 故认为三个地区花生污染不全相等.22226384.117.91294411 410ijijAnRC二、两组及多组构成比的比较n例例5-4 5-4 1986年某地城市和农村20至40岁已婚妇女避孕方法情况如下表。n试分析该地城市和农村避孕方法的总体分布是否有差别?试分析该地城市和农村避孕方法的总体分布是否有差别?地区避 孕 方 法合计节育器服避孕药避孕套其 它

16、城市 153 153(0.39)3333(0.08)165 165(0.42)4040(0.11)391农村 320320(0.71)7575(0.16)43 43(0.09)1818(0.04)456合计 473(0.56)108(0.13)208(0.24)58(0.07)847某地城市和农村已婚妇女避孕方法情况nH0:城市和农村已婚妇女避孕方法的总体分布相同总体分布相同nH1:城市和农村已婚妇女避孕方法的总体分布不同总体分布不同n根据H0假设,111224391 473391 108391 0.56218.35391 0.1349.86847847456 58456 0.0731.238

17、47TTT22222(153 218.35)(33 49.86)(18 31.23).151.099218.3549.86()31.23A TT 3)14)(12(22223318847.1151.099108 39158 4561ijijAnRCn查 界值表,得P0.05,按=0.05水准拒绝H0,接受H1。n故可认为城市和农村已婚妇女避孕方法的总体分布不同2l例例5-6 5-6 某药厂为了探讨根据外观状况判断内在质量的可能性,随机抽取若干同类药剂在相同条件下放置一年后,分别检验内在质量和外观状况,得如下数据.l试分析两种属性之间是否独立?(试分析两种属性之间是否独立?(=0.001=0.0

18、01)外观状况内在质量合计好中差好中差3584122945716524424合计474528120nEXCEL演示第三节第三节 分类资料的关联性检验分类资料的关联性检验n 例例5-5 某研究者为了解不同人种血型分布情况,随机抽取1253受检者,观察其人种和血型两个变量,得资料见表。n问人种与血型间有无关联性及关联程度。人种ABOAB合 计白种658613856345黄种黑种1154628538201557494675233合计2264093942241253n 对于两个分类变量皆为无序分类变量的行列表资料,又称为双向无序表资料,可用行列表资料检验推断两个分类变量间有无关联。实例实例nH0:人种

19、与血型间无关联 nH1:人种与血型间有关联2222222222222658613856115285345 226345 409345 394345 224675 226675 409125320174463855941675 394675 224233 226233 409233 394233 224142.72n据自由度为6,查界值表得P0.005。按a=0.05检验水准拒绝H0,接受H1,可以认为人种与血型间有关联。22(1)RCAnn n人种ABOAB合 计白种658613856345黄种黑种1154628538201557494675233合计2264093942241253 行行 列

20、表资料的注意事项列表资料的注意事项1、不能有理论数T1,并且1T 5的格子数不超过总格子数的1/5。否则:a:增大样本例数以增大理论数 b:删去理论数太小的行或列 c:合理合并2、P0.05,只能认为各总体率或构成比总的来说有差别,不能说明它们彼此之间均有差别,需作多个样本率间的多重比较才能确定差别所在。第四节 频数分布拟合优度的检验(自学)n例例5-7 有100棵某品种小麦株高的样本分组资料如下表,并且已经算得样本S5.2.试判断该小麦的株高表现是否遵从正态分布。94.8,x 100株小麦的分组资料组中值838689929598101104107组限84.587.590.593.596.599.5102.5105.5108.5组频率f36122023191052理论频数2.3015.63712.419.7222.6818.8811.374.9521.981合并合并7.93812.419.7222.6818.8811.376.933 2 20.12960.12900.00400.00450.00080.16510.0006

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!