x2检验-spss_0

上传人:缘*** 文档编号:63137907 上传时间:2022-03-17 格式:DOCX 页数:18 大小:42.66KB
收藏 版权申诉 举报 下载
x2检验-spss_0_第1页
第1页 / 共18页
x2检验-spss_0_第2页
第2页 / 共18页
x2检验-spss_0_第3页
第3页 / 共18页
资源描述:

《x2检验-spss_0》由会员分享,可在线阅读,更多相关《x2检验-spss_0(18页珍藏版)》请在装配图网上搜索。

1、x2检验-spssX2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。X2检验类型有:四格表资料X2检验(用于两样本率的检验),行列表X2检验(用于两个及两个以上样本率或构成比的检验),行列列联表X2检验(用于计数资料的相关分析)。在SPSS中,所有X2检验均用Crosstabs完成。Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kap

2、pa值,分层X2(X2(FishersExactTest)值。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。M-H)。如果安装了相应模块,还可计算n维列联表的确切概率界面说明【Rows框】用于选择行*列表中的行变量。Columns框】用于选择行*列表中的列变量。【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将

3、进行详细的解释。【Displayclusteredbarcharts复选框】显示重叠条图。Suppresstable复选框】禁止在结果中输出行*列表。Statistics按钮弹出Statistics对话框,用于定义所需计算的统计量。Chi-square复选框:计算X2值。Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。Contingencycoefficient复选框:即列联系数,其值界于01之间;PhiandCramersV复选框:这两者也是基于X2值的,Phi在

4、四格表X2检验中界于-11之间,在R*C表X2检验中界于01之间;CramersV则界于01之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertaintycoefficient复选框:不确定系数,以嫡为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。Gamma复选框:界于。1之间,所有观察实际数集中于左上角和右下角时,其值为1;Somersd复选框:为独立变量上不存

5、在同分的偶对中,同序对子数超过异序对子数的比例;Kendallstau-b复选框:界于-11之间;Kendallstau-c复选框:界于-11之间;Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;Kappa复选框:计算Kappa值,即内部一致性系数;Risk复选框:计算比数比OR值;McNemanr复选框:进行McNemanr检验,即常用的配对计数资料的X2检验(一种非参检验);CochransandMantel-Haenszelstatistics复选框:计算X2的),可在下方输出H0假设的OR值,默认为1。Cells按钮弹出Cells对话框,用于定义列联表单

6、元格中需要计算的指标:Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected);M-H统计量(分层X2,也有写为X2CMHPercentages复选框组:是否输出行百分数(RoW、列百分数(Columrj)以及合计百分数(Total);Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj.Standardized);Format钮】用于选择行变量是升序还是降序排列。分析实例一、四格表资料的X2检验例6

7、.1某医生用味喃硝胺和甲富咪服治疗十二指肠溃疡,结果如下表,问两种药物治疗效果有无差别?组别愈合未愈合合计有效率(%味喃硝胺5486287.09甲富咪月瓜44206468.75合计982812677.78【建立数据文件】由于此处给出的是频数表(大部分资料都以这种形式给出),因此在建立数据集时可以直接输入三个变量:行变量(分组变量):变量名取R,变量值为1=吠喃硝胺组,2二甲富咪服组列变量(疗效变量):变量名取C,变量值为1二愈合,2二未愈合指示每个格子中频数的变量:变量名取F,直接输入各个格子的频数。所建立的数据集如下表。然后用WeightCases对话框指定频数变量进行加权,最后调用Cros

8、stabs过程进行X2检验。RCF1.001.0054.001.002.0044.002.001.008.002.002.0020.00【操作过程】Data二二WeightCases(对数据按频数进行加权)WeightCasesby单选框:选中FreqencyVariable:选入F单击ok钮Analyze二二DescriptiveStatistics二二CrosstabsRows框:选入RColumns框:CStatistics按钮:选中Chi-square复选框,单击Continue钮Cells.按钮:选中Row复选框,单击Continue钮单击OK钮【结果解释】上题分析结果如下:Case

9、ProcessingSummaryl26100.0%0.0%126100.0%组别*疗效NPercentNPercentNPercentValidMissingTotalCases首先是有效记录数和处理记录缺失值情况报告,可见126例均为有效值。组另U*疗效Crosstabulation5486287.1%12.9%100.0%44206468.8%31.3%100.0%982812677.8%22.2%100.0%Count%within组别Count%within组别Count%within组别味喃硝胺甲富米月瓜组别Total愈合未愈合疗效Total上表为列出的四格表,其中加入变量值和变量

10、值标签,看起来很清楚。Chi-SquareTests6.133b1.0135.1186.30411.024.012.018.0116.0841.014126PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFishersExactTestLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.0cells(.0%)haveexpectedco

11、untlessthan5.Theminimumexpectedcountis13.78.b.上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(ExactSig.2-sided)、单侧精确概率(ExactSig.1-sided);从上到下为:Pearson卡方(PearsonChi-Square即常用的卡方检验)、连续性校正的卡方值(ContinuityCorrection)、对数似然比方法计算的卡方(LikelihoodRatio)、Fishers确切概率法(FishersExactTest)、线性

12、相关白卡方值(LinearbyLinearAssociation)、有效记录数(NofValidCases)。另外,ContinuityCorrection和Pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无须校正,直接采用第一行的检验结果,即X2=6.133,P=0.013。因P=0.013,可以认为两种药物疗效有差异,结合样本率,可以认为吠喃硝胺有效率高于甲富米服。如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的

13、对我们而言用处不大,可以视而不见。二、配对计数资料X2检验例6.2有28份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果如下表,试检验甲、乙培养基生长率有无差别。甲乙两种结核杆菌培养基的培养结果乙培养基甲培养基+合1120178合计121628【建立数据文件】输入三个变量:行变量(代表甲培养基):变量名取R,变量值为1=生长,2=未生长列变量(代表甲培养基):变量名取C,变量值为1=生长,2=未生长指示每个格子中频数的变量:变量名取F,直接输入各个格子的频数。所建立的数据集如下表。然后用WeightCases对话框指定频数变量进行加权,最后调用Crosstabs过程进行

14、X2检验。RCF1.001.0011.001.002.009.002.001.001.002.002.007.00【操作过程】1.Data=WeightCases(对数据按频数进行加权)WeightCasesby单选框:选中FreqencyVariable:选入F单击ok钮2.Analyze=DescriptiveStatistics=CrosstabsRows框:选入RColumns框:CStatistics按钮:选中Chi-square复选框(做成组X2检验,分析甲乙两培养基分析结果有无相关)选中McNemanr复选框:(做配对X2检验,分析甲乙培养基阳性率有无差异)单击Continue钮

15、Cells.按钮:选中Row复选框,单击Continue钮单击OK钮【结果解释】CaseProcessingSummary28100.0%0.0%28100.0%甲培养基*乙培养基NPercentNPercentNPercentValidMissingTotalCases上表为有效例数,缺失例数和总例数的情况,28例均有效.甲培养基*乙培养基CrosstabulationCount11920198121628+-甲培养基Total+-乙培养基Total上表输出配对四格表数据。Chi-SquareTests4.215b1.0402.6584.68911.103.030.088.0484.0641

16、.044.021c28PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFishersExactTestLinear-by-LinearAssociationMcNemarTestNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.2cells(50.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis3.43.b.Binomiald

17、istributionused.c.上表为X2检验的结果。首先是成组X2检验,X2=4.21,P=0.040,可以认为甲乙两培养基的结果有相关性(即甲阳性,乙可能也阳性)。下面做了配对X2检验(McNemarTest),用精确概率法计算,P=0.021 (双侧)可以认为甲乙两培养基阳性率差异有统计学意义。三、RC表X2检验例6.3某市三个地区出生婴儿的畸形发生情况如下表,试比较这三个地区出生婴儿畸形率有无差异。地区畸形数无畸形数合计发生率()重污染区1143278339233.61一般市区444401034054710.95农村67827583428.03合计62551655228111.95

18、这是32表资料,要进行3个样本率的比较。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取R,变量值为1=重污染区,2=一般市区,农村。列变量(疗效变量):变量名取C,变量值为1=畸形,2=非畸形指示每个格子中频数的变量:变量名取F,直接输入各个格子的频数。所建立的数据集如下表。RCF111141232782144422401033167【操作过程】1.Data=WeightCases(对数据按频数进行加权)WeightCasesby单选框:选中FreqencyVariable:选入F单击OK钮2.Analyze=DescriptiveStatistics=CrosstabsRow

19、s框:选入RColumns框:CStatistics按钮:选中Chi-square复选框单击Continue钮Cells.按钮:选中Row复选框单击Continue钮单击OK钮【结果解释】CaseProcessingSummary52281100.0%0.0%52281100.0%地区*疾病NPercentNPercentNPercentValidMissingTotalCases上表为有效例数,缺失例数和总例数的情况,52281例均有效。328275地区*疾病Crosstabulation1143.4%327896.6%3392100.0%4441.1%4010398.9%827540547

20、100.0%834267.8%6251.2%99.2%5165698.8%100.0%52281100.0%Count%within地区Count%within地区Count%within地区Count%within地区重污染区一般市区农村地区Total畸形非畸形疾病Total上表输出原始数据,并计算行百分数,重污染区畸形率为3.4%,一股市区为1.1%,农村为0.8%。Chi-SquareTestsl48.984a2.000106.2442.00084.7191.00052281PearsonChi-SquareLikelihoodRatioLinear-by-LinearAssociati

21、onNofValidCasesValuedfAsymp.Sig.(2-sided)0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis40.55.a.上上表为X2检验的结果,X2=148.984,自由度=2,P=0.000,可以认为这三个区新生儿畸形率差异有统计学意义,畸形率不同或不全相同。至于哪些地区有差别,那些地区没有差别,或都有差别,可进行X2分割。四、RC列联表资料X2检验列联表是指每个观察对象按两种属性交叉分组归类,而且每种属性的分类都是有序的,这样整理出的资料称双向有序列联表。配对计数资料就是一个22列联表。

22、例6.4下表资料是492名不同期次矽肺患者其肺门密度级别的资料,试分析矽肺期次和肺门密度级别有无关系。不同期次矽肺患者肺门密度级别分布肺门密度级别矽肺期次合计+4318814245H19672169m6175578合计50301141492该资料是i个33列联表。每个矽肺病人按矽肺的期次和胸片肺门密度的级别进行交叉分类归组。使用x2检验可以分析这两个属性之间有无相关性。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取R,代表矽肺期次,变量值为1=1期,2=H期,3=田期。列变量(疗效变量):变量名取C,代表肺门密度,变量值为1=+,2=+,3=+。指示每个格子中频数的变量:变量名

23、取F,直接输入各个格子的频数。所建立的数据集如下表。【操作过程】1.Data=WeightCases(对数据按频数进行加权)WeightCasesby单选框:选中FreqencyVariable:选入F单击OK钮2.Analyze=DescriptiveStatistics=CrosstabsRows框:选入RColumns框:CStatistics按钮:选中Chi-square复选框(做X2检9会)选种Kendallstau-b复选框(计算列联系数)选种Kappa复选框(计算Kappa值,分析一致性)单击Continue钮Cells.按钮:选中Row复选框(计算行百分数)单击Continue

24、钮单击OK钮【结果解释】RCF11431218813142112296237231632173355CaseProcessingSummary492100.0%0.0%492100.0%矽肺期次*肺门密度级别NPercentNPercentNPercentValidMissingTotalCases上表为有效例数,缺失例数和总例数的情况,492例均有效。矽肺期次*肺门密度级别Crosstabulation431881424517.6%76.7%5.7%100.0%19672169.6%56.8%42.6%100.0%61755787.7%21.8%70.5%100.0%503011414921

25、0.2%61.2%28.7%100.0%Count%within矽肺期次Count%within矽肺期次Count%within矽肺期次Count%within矽肺期次I期U期田期矽肺期次Total+肺门密度级别Total上表输出原始数据,并计算行百分数。Chi-SquareTests163.007a4.000184.7924.000125.5101.000492PearsonChi-SquareLikelihoodRatioLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)0cells(.0%)haveexpe

26、ctedcountlessthan5.Theminimumexpectedcountis7.93.a.上表结果为X2检验的结果,X2=163.007,自由度=4,P=0.000,可以认为矽肺期次和肺门密度有关,结合下表的列联系数(Kendallstau-b)为0.498,两者呈正相关的关系,即矽肺期别越高,肺门密度级别也越高。SymmetricMeasures.498.03413.680.000.127492.0285.070.000Kendallstau-bKappaOrdinalbyOrdinalMeasureofAgreementNofValidCasesValueAsymp.Std.E

27、rroraApprox.TbApprox.Sig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.上表输出Kendallstau-b列联系数,其值为0.498,标准误为0.034,对列联系数检验的统计量为13.680,P=0.000。Kappa=0.127,其标准误=0.028,对Kappa值检验的统计量为5.070,P=0.000,可认为两者有一致性。根据经验Kappa0.75,表明两者一致性好;0.75Kappa0.4,表明一致性一般;Kappa0.4表明一致

28、性差。矽肺期次和肺门密度有一致性,但一致性差。习题1、某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,如下表,问两者带菌率有无差别?采样地点检查例数阳性例数带菌率()屠宰场2827.14零售点14535.71合计42716.672.以眼为单位观察20岁以上居民眼睛的晶状体点状混浊程度与年龄间的关系得资料如下,分析两者之间有无关系。晶状体混浊程度年龄(岁)合计+202256744336301411016330540158128132418合计52429623910593、某医院比较急性黄疸型肝炎与正常人在超声波肝波波型上的表现,结果如下。问两组病人肝波波型的密度构成有无差别?

29、波型密度组别正常较密很密合计黄疸型肝炎组1243232287正常人组2773911327合计289822436144、为研究血型与胃溃疡、胃癌的关系,得下表资料,因AB型例数少而省略,问各组血型构成有无差别?血型合计0AB胃溃疡9936791341806胃癌39341684893对照2902265257060974288372078887965、有21例急性心肌梗塞并发休克患者,分别采用西药和中西药结合的方法,疗效如下。问两组疗效有无差别?两种疗法对心肌梗塞的疗效比较治疗组康复死亡合计西药组6511中西药组9110合计155216、现有170例已确诊的乳癌患者,用两种方法对其进行诊断,问:这两种诊断方法的诊断结果是否有关系?两种方法何者为优?两者的一致性如何?临床诊断X线诊断乳癌非乳癌乳癌2430非乳癌70467、比较某市三个地区出生婴儿的畸形率有无差异。某市三个地区出生婴儿的畸形率地区畸形数无畸形数合计畸形率()重污染区1143278339233.61一股市区444401034054710.95农村67827583428.03合计625516565228111.95

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!