SPSS17.0研究上教学

上传人:wux****ua 文档编号:16322546 上传时间:2020-09-26 格式:PPT 页数:153 大小:4.59MB
收藏 版权申诉 举报 下载
SPSS17.0研究上教学_第1页
第1页 / 共153页
SPSS17.0研究上教学_第2页
第2页 / 共153页
SPSS17.0研究上教学_第3页
第3页 / 共153页
资源描述:

《SPSS17.0研究上教学》由会员分享,可在线阅读,更多相关《SPSS17.0研究上教学(153页珍藏版)》请在装配图网上搜索。

1、SPSS软件基本统计分析应用介绍,医学统计学中软件应用 一、统计软件概述 从20世纪60年代开始,统计软件(statistical software) 在数量和质量上有了很大的发展,应用最早、范围最广、最完善的三种软件是: SAS(Statistical Analysis System) -美国SAS研究公司 SPSS(Statistical Package for the Social Science) - 美国SPSS研究公司 BMDP(Biomedical Computer Programs) -美国加利福尼亚大学,此外,SYSTAT、 STATA 、STATISTICA 90年代后这些

2、软件包都开发出Windows下版本,使用更加方便. 国内也有:原上海医科大学的POMS、原华西医科大学的PEMS、第四军医大学的SPLM、北京万通电子技术公司的SDAS、上海第二医科大学的Exact-P 等等汉化版的。 还有一些数据管理软件也有一些统计分析功能: Fox base 、Excel 、Fox pro、 EPI INFO、 Epi data等等。,二、统计软件包的评价和选择 1、实用性:良好的用户界面,灵活的处理方式,简明的语句或命令。 2、数据文件的管理:进行数据录入、查询、修改、转换、选择等功能。即兼容性好。数据文件扩张名: SPSS-.sav DATA-.dat dBbaseF

3、ox-.dbf excel-.xls EPI-.rec SAS-sas,3、统计分析功能: 包括统计设计、统计描述、统 计推断所涉及到的统计分析。4、编辑功能5、处理数据的容量:流调资料6、在线帮助功能 提供随时可用的有关方法操作步骤地帮助功能7、统计绘图和制表,一、概述 SPSS(Statistical Package for the Social Science)社会科学统计软件包是由美国斯坦福大学20世纪80年代初研制的,它与SAS和BMDP共同组成世界上三大流行统计分析软件。广泛适用于自然科学和社会科学的各个领域,特别是可以满足经济学、医学、生物学、商业、金融、教育等的多种要求。SPS

4、S目前在国内已逐渐流行起来。 SPSS/Win(v11.0)更名为: Statistical Product and Service Solutons (统计产品和服务解决方案)。 本文将介绍SPSS10.0版的基本统计分析(描述统计、u检验、t检验、F检验、q检验、X2 检验、秩和检验、线性相关与回归等)的方法,旨在抛砖引玉,举一反三,共同学习。,直接双击桌面上“SPSS for Windows”快捷图标。,点击“开始” “程序” “SPSS for Windows” “SPSS10.0 for Windows” 出现SPSS的数据窗口,开始选择菜单,共有六种选择项。,第一讲 SPSS数据编

5、码录入,进入SPSS之前的准备工作,2 进入SPSS之前的准备工作,2-1-1数据资料的形式: 矩阵式数据数据要求每一横行为一个个案(Case),纵列按变量排列,形成矩阵格式。,2-1数据资料的形式及编码,2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,2-1-3编码的步骤: 1)确定变量;,变量: 用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要

6、注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,问题009:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,变量名: 一个数据文件中, 一个变量只能有一个唯一名称。,码位:某一变量在 数据文件中占据的栏位,码数: 某一变量由几位数组成。,该变量是数值型(Numeric)如定距、定比, 还是字串型(String),如定类、定序。 前者在统计中可以做高级运算,后者则不可以。,不适于被访人回答的问题的编码。 一般采用7,97,997等。,被访人回答不知道时的编码。 一般采用8,98,998等。,被访人拒绝回答某变量时的编码。

7、 一般采用9,99,999等。,问卷中出现漏答时的处理编码。 一般采用9,99,999等。,2,3,100011,3)编码: 根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。,2-2 数据录入,采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。,作业:将问卷填答好,并做出问题001问题011的编码表,将自

8、己的答案在问卷上编码。下一节课带问卷上机。,练习:,第二讲 SPSS数据定义,SPSS的运行步骤如下:,录入数据,SPSS数据定义的命令共有4个,分别用来定义数据的变量名、变量名标签、变量值标签和缺失值。,1 变量名定义命令:Data List 1-1命令格式:,Data List File=原始数据文件名(*.dat) /变量1名 码位 变量2名 码位变量n名 码位.,这些数据定义命令都要写在SPSS的语句窗口(Syntax)里,而后运行。,2 变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。,2-1 命令格式: Variable labels 变量1名 标

9、签 /变量2名 标签 /变量3名 标签 /变量n名 标签 .,示例: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .,或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 .,2-2 要求: 变量名要和已定义过的名称相一致; 标签用中、西文均可,但长度不要超过120个字符,即60个汉字。,练习: 问卷 p1变量名标签定义并

10、运行。,3. 变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。,3-1 格式: Value Labels 变量名 值1 标签 值2 标签 值3 标签 /变量名 值1 标签 值2 标签 值3 标签 .,示例: Value labels W01 1男 2女 /W02 1未婚 2已婚 3离婚后未再婚 4离婚后再婚 5丧偶后未再婚 6丧偶后再婚 7未婚同居 /W03 1不识字或识字很少 2初小 3高小 4初中 5高中中专或中技 6大专 7大学本科 8研究生以上 /W04 1不识字或识字很少 2初小 3高小 4初中 5高中中专或中技 6大专 7大学本科 8研究生以上

11、 0不适用 .,3-2 要求: 变量名要和已定义过的名称相一致; 标签用中、西文均可,但长度不要超过60个字符, 即30个汉字。,练习: 问卷问题001007的变量值标签定义并运行。,4 缺失值定义命令:Missing Value,4-1 格式: Missing Value 变量名 变量名 变量名(缺失值1,缺失值2,) /变量名 变量名 变量名(缺失值1,缺失值2,) .,示例: Missing Value W01 W02 W03(9)/W04 (0,9) /W01a W8.1 W8.2 W8.3(99) .,4-2 要求: 缺失值的定义与前面的命令格式不同,它是按照缺失值的码位数来排列变量

12、的。有相同码位数的变量放在一组。,上机作业: 1、在EXCEL下编辑器下录入问卷。 2、运用SPSS的4个数据定义命令对问卷的第一页进行定义。,进入数据编辑窗口。,变量属性设置窗口。,1-2要求: 变量名不能超过8个字符; 变量名不能以数字开头; 变量名中不能包含,/、?、等运算和逻辑符号。 当相邻变量名称上存在顺序且码位相同时,可用简略方法 : W02 8 W03 9 W04 10.可换为 W02 to W04 8-10. 当变量值是字符时,在码位后加(a);如: W7 12(a); 当变量值包含小数时,在码位后加(n),n表示小数的位数。如:446.79,在录入时要录成 44679,定义时

13、为:W12 12-16(2);,第三讲 SPSS的主要窗口和菜单,1 SPSS的3个主要窗口 1-1 数据编辑器窗口(SPSS Data Editor):用来编辑和显示数据;在此窗口中的文件名称为*. sav。 1-2 程序语句编辑器窗口( SPSS Syntax Editor):用来编写各种程序;在此窗口中的文件名称为*. sps。 1-3 结果观看窗口( SPSS Viewer):显示统计运算结果;在此窗口中的文件名称为*. spo。,2 SPSS 数据编辑器的主要菜单 2-1 File 菜单:文件管理 New;Open;Save;Save as;Exit。 2-2 Edit 菜单:编辑

14、Undo;Cut;Copy;Paste;Clear; Find; 2-3 View菜单:视图 Fonts;Grid lines;Value labels。,2-4 Data菜单:数据整理 define variables;Insert variables;Insert case; go to case;sort case;select case。 2-5 Transform菜单:数据转换 recode;compute;count。 2-6 Statistics菜单:统计 2-7 Graphs菜单:统计图 2-8 Utilities菜单:工具附件 2-9 Windows菜单:窗口 2-10 He

15、lp菜单:帮助,第四讲 SPSS的单变量描述统计,1 单变量描述统计介绍 A变量的尺度: a 定类 Category Scale:只能计次 b 定序 Ordinal Scale:计次、排序 c 定距 Interval Scale:计次、排序、加减 d 定比 Ratio Scale:计次、排序、加减、乘除,4、SPSS10.0的分析(Analyze)功能: 一、报表 Reports 二、描述统计 Descriptive Statistics 1、频数分析 Frequencies 2、描述统计 Descriptives 3、数据探索 Explore 4、交叉表 Crosstabs 三、均值比较 C

16、ompare Means 1、平均数分析 Means 2、单一样本 t检验 One-Sample T Test 3、独立样本 t检验 Independent-Samples T Test 4、配对样本 t检验 Paired-Sample T Test 5、单因素方差分析 One-Way ANOVA,四、一般线性模型 General Linear Model 1、单变量方差分析 Univariate 五、相关分析 Correlate 1、双变量相关 Bivariate 2、偏相关 Partial 3、距离相关 Distances 六、回归分析 Regression 1、线性回归 Linear 七

17、、对数线性 Loglinear 八、聚类分析 Classify 九、数据简化 Data Reduction,十、尺度分析 Scale 十一、非参数检验 Nonparametric Tests 1、 卡方检验 Chi-Square 2、 二项式检验 Binomial 3、 游程检验 Runs 4、 单样本柯斯检验 1-Sample K-S 5、 两个独立样本检验 2 Independent Samples 6、 多个独立样本检验 K Independent Samples 7、 两个相关样本检验 2 Related Samples 8、 多个相关样本检验 K Related Samples 十二

18、、存活分析 Survival 十三、多项选择 Multiple Response,5、统计资料的分类及常用统计学处理方法: (1)计量资料(数值变量,一般有计量单位):参数统计,常用:平均数、标准差、u检验、t检验、方差分析(F检验)、相关与回归、时间数列、多元分析等等(一般要求:资料服从正态分布、近似正态分布或对称分布、方差具有齐同性)。 (2)计数资料(无序分类变量):常用:率、构成比、X2检验等等。 (3)等级资料(有序分类变量):非参数统计,是介于计量资料和计数资料之间的半定量资料,常用:率、构成比、秩和检验、Ridit分析等等。,B变量的统计描述: 分布 Distribution 集

19、中趋势 Central tendency 离散趋势 Dispersion,2 SPSS的单变量描述统计命令 A Frequencies: 频数统计 StatisticsSummarizeFrequencies,变量值,频数,百分比,有效百分比,累计百分比,B Descriptives: 定距变量描述统计 StatisticsSummarizeDescriptives,变量名,平均数,标准差,最小值,最大值,3、统计处理方法:设置变量属性数据录入选择“分析Analyze”菜单统计分析程序对话框项目选择(输入参数)产生结果。,4、SPSS10.0的分析(Analyze)功能: 一、报表 Repor

20、ts 二、描述统计 Descriptive Statistics 1、频数分析 Frequencies 2、描述统计 Descriptives 3、数据探索 Explore 4、交叉表 Crosstabs 三、均值比较 Compare Means 1、平均数分析 Means 2、单一样本 t检验 One-Sample T Test 3、独立样本 t检验 Independent-Samples T Test 4、配对样本 t检验 Paired-Sample T Test 5、单因素方差分析 One-Way ANOVA,四、一般线性模型 General Linear Model 1、单变量方差分析

21、 Univariate 五、相关分析 Correlate 1、双变量相关 Bivariate 2、偏相关 Partial 3、距离相关 Distances 六、回归分析 Regression 1、线性回归 Linear 七、对数线性 Loglinear 八、聚类分析 Classify 九、数据简化 Data Reduction,十、尺度分析 Scale 十一、非参数检验 Nonparametric Tests 1、 卡方检验 Chi-Square 2、 二项式检验 Binomial 3、 游程检验 Runs 4、 单样本柯斯检验 1-Sample K-S 5、 两个独立样本检验 2 Indep

22、endent Samples 6、 多个独立样本检验 K Independent Samples 7、 两个相关样本检验 2 Related Samples 8、 多个相关样本检验 K Related Samples 十二、存活分析 Survival 十三、多项选择 Multiple Response,5、统计资料的分类及常用统计学处理方法: (1)计量资料(数值变量,一般有计量单位):参数统计,常用:平均数、标准差、u检验、t检验、方差分析(F检验)、相关与回归、时间数列、多元分析等等(一般要求:资料服从正态分布、近似正态分布或对称分布、方差具有齐同性)。 (2)计数资料(无序分类变量):常

23、用:率、构成比、X2检验等等。 (3)等级资料(有序分类变量):非参数统计,是介于计量资料和计数资料之间的半定量资料,常用:率、构成比、秩和检验、Ridit分析等等。,二、描述性统计: 例1:某市120名12岁男孩身高(cm)资料如下:试作描述性统计分析。142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.

24、3 156.3 141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.

25、9 148.1 134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 144.0 135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 142.1 140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7 139.9,操作方法:A、定义变量属性:名称Name身高, ,B、数据录入:在DATA窗口第一列录入上述数据。,C、

26、选择统计分析方法:分析Analyze描述性统计Descriptive Statistics 次数分配表Frequencies主对话框。,D、主对话框:选定身高进入分析变量框。,E、分别选定“统计量” 、“图表”和“格式”按钮出现下面三个次级对话框。根据研究需要进行统计指标选择后,按“继续”按钮返回主对话框。,选择:四分位数、2个百分位数、全部集中趋势和离散趋势指标、偏态和峰度系数。,作直方图并附正态曲线。,变量按升序排列、 变量分5组,F、经过上述选择后在主对话框按“确定OK”按钮,产生如左表的描述性结果。,12岁男孩的身高次数分布直方图,三、均数比较: t检验、u检验、F检验(q检验) 1、

27、两个小样本资料均数的比较t检验(t, 检验两个方差不齐性的小样本资料): 例2:将27例确诊为肠憩室患者随机分为两组,分别给予甲、乙两种饮食,观察饮食排出时间(小时)结果如下,试问两种饮食对肠蠕动效果有无差别? 甲饮食组 76 75 44 55 51 66 69 68 52 60 71 62 70 75 乙饮食组 97 74 79 83 95 101 98 95 52 64 68 88 83 已知:n114 n2 13 x163.86 x282.85 S110.11 S2 15.00,、数据录入。 、分析Analyze 比较平均数法Compare Means 独立样本T检验Independen

28、t-Samples T Test 主对话框。,、把排除时间送入检验变量框 把分组送入分组变量框定义组别按“选项”按钮次级对话框。,、输入置信区间(95) 按“继续”按钮返回主对话框。,Group Statistics,14,63.8571,10.1136,2.7030,13,82.8462,15.0047,4.1616,分组,甲饮食组,乙饮食组,排出时间,N,Mean,Std.,Deviation,Std. Error,Mean,Independent Samples Test,1.659,.210,-3.882,25,.001,-18.9890,4.8911,-29.06,-8.92,-3.

29、827,20.837,.001,-18.9890,4.9623,-29.31,-8.66,Equal variances assumed,Equal variances not,assumed,F,Sig.,Levenes Test for,Equality of Variances,t,df,Sig.,(2-tailed),Mean,Difference,Std. Error,Difference,Lower,Upper,95% Confidence,Interval of the,Difference,t-test for Equality of Means,、在主对话框中按“确定”按钮产

30、生结果(见上图)。,上表是分组描述性统计结果,下表t检验结果:,3、配对资料比较 例3:研究活血化瘀汤对动物血管灌流量的影响,测得 8只家兔给药前、给药后血管灌流量数据(相对单位)如下,试问:活血化瘀汤有无扩张血管的作用? 家兔号 给药前 给药后 差值d d2 1 15.3 31.0 -15.7 246.49 2 10.0 14.0 - 4.0 16.00 3 9.0 15.7 - 6.7 44.89 4 32.7 26.7 6.0 36.00 5 5.7 11.7 - 6.0 36.00 6 13.2 22.0 - 8.8 77.44 7 25.3 40.0 -14.7 216.09 8 3

31、2.1 42.6 -10.5 110.25,、数据录入。 、分析Analyze比较平均数法Compare Means 成对样本T检验Paired-Sample T Test 主对话框。,、把两个都送入检验变量框按“选项”按钮次级对话框。输入置信区间(95)按“继续”按钮返回主对话框。,D、在主对话框中按“确定”按钮产生结果(见下图)。,上表是配对资料描述性统计结果。,Paired Samples Correlations,8,.817,.013,给药前 & 给药后,Pair 1,N,Correlation,Sig.,Paired Samples Test,-7.4750,6.8025,2.40

32、50,-13.162,-1.7880,-3.108,7,.017,给药前 - 给药后,Mean,Std.,Deviation,Std. Error,Mean,Lower,Upper,95% Confidence,Interval of the,Difference,Paired Differences,t,df,Sig.,(2-tailed),下表是配对资料相关分析和t检验结果。,4、单因素方差分析及多组样本均数的两两比较: 例4:为研究某药物的抑癌作用,将一批小白鼠致癌后随机分为四组,三个实验组分别注射不同剂量的药物(0.5ml、1.0ml、1.5ml) ,一个对照组不用药,一定时间后测定四

33、组小白鼠的癌肿重量(g)结果见下表,试比较不同剂量的药物的抑癌作用。 对照组 实验A组 实验B组 实验C组 3.6 3.0 0.4 3.3 4.5 2.3 1.7 1.2 4.2 2.4 2.3 0.0 4.4 1.1 4.5 2.7 3.7 4.0 3.6 3.0 5.6 3.7 1.3 3.2 7.0 2.7 3.2 0.6 4.1 1.9 3.0 1.4 5.0 2.6 2.1 1.2 4.5 1.3 2.5 2.1,A、数据录入分析Analyze比较平均数法Compare Means 单因素方差分析One-Way ANOVA 主对话框。,B、把肿瘤重量送入检验变量框把分组送入因子框。,

34、C、按Post Hoc检验按钮点击LSD和Tamhanes T2检验复选框输入显著性水平(0.05) 按“继续”按钮返回主对话框。,Descriptives描述性结果,肿瘤重量,10,4.6600,1.0091,.3191,3.9382,5.3818,3.60,7.00,10,2.5000,.9309,.2944,1.8340,3.1660,1.10,4.00,10,2.4600,1.1843,.3745,1.6128,3.3072,.40,4.50,10,1.8700,1.1576,.3661,1.0419,2.6981,.00,3.30,40,2.8725,1.4913,.2358,2.3

35、955,3.3495,.00,7.00,对照组,实验A组,实验B组,实验C组,Total,N,Mean,Std.,Deviation,Std. Error,Lower Bound,Upper Bound,95% Confidence,Interval for Mean,Minimum,Maximum,D、按“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。,E、在主对话框中按“确定”按钮产生结果(见下图)。,Test of Homogeneity of Variances方差齐性检验,均值图,ANOVA方差分析表,肿瘤重量,45.091,3,15.030,12.992,.

36、000,41.649,36,1.157,86.740,39,Between Groups,Within Groups,Total,Sum of,Squares,df,Mean Square,F,Sig.,*.,四、相关与回归分析 例5、某医师测得13例 8岁男孩体重(kg)和心脏横径(cm)的数据如下表所示,试作相关和回归分析。 编号 体重x 心脏横径y x2 y2 xy 1 25.5 9.2 650.25 84.64 234.60 2 19.5 7.8 380.25 60.84 152.10 3 24.0 9.4 576.00 88.36 225.60 4 20.5 8.6 420.25 7

37、3.96 176.30 5 25.0 9.0 625.00 81.00 225.00 6 22.0 8.8 484.00 77.44 193.60 7 21.5 9.0 462.25 81.00 193.50 8 23.5 9.4 552.25 88.36 220.90 9 26.5 9.7 702.25 94.09 257.05 10 23.5 8.8 552.25 77.44 206.80 11 22.0 8.5 484.00 72.25 187.00 12 20.0 8.2 400.00 67.24 164.00 13 28.0 9.9 784.00 98.01 277.20 合计 30

38、1.5 116.3 7072.80 1044.26 2713.70,1、相关分析操作方法: A、数据录入。,B、分析Analyze相关Correlate 二元相关分析 Bivariate 主对话框。,C、把体重和心脏横径送入检验变量框选择相关系数复选框选择显著性水平(双侧) 。,D、按“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。,Correlations,1.000,.893,*,.,.000,13,13,.893,*,1.000,.000,.,13,13,Pearson Correlation,Sig. (2-tailed),N,Pearson Correlati

39、on,Sig. (2-tailed),N,心脏横径,体重,心脏横径,体重,Correlation is significant at the 0.01 level (2-tailed).,*.,E、在主对话框中按“确定”按钮产生结果(见下表)。,上表是描述性统计结果,下表是皮尔逊相关系数表。,Correlations肯德尔和斯皮尔曼等级相关系数,1.000,.755,*,.,.000,13,13,.755,*,1.000,.000,.,13,13,1.000,.876,*,.,.000,13,13,.876,*,1.000,.000,.,13,13,Correlation Coefficien

40、t,Sig. (2-tailed),N,Correlation Coefficient,Sig. (2-tailed),N,Correlation Coefficient,Sig. (2-tailed),N,Correlation Coefficient,Sig. (2-tailed),N,体重,心脏横径,体重,Kendalls tau_b,Spearmans rho,心脏横径,体重,Correlation is significant at the .01 level (2-tailed).,*.,心脏横径,2、回归分析操作方法:A、数据录入。,B、分析Analyze 回归方法Regress

41、ion 线性回归Linear 主对话框。,C、把心脏横径送入依变量框把体重送入自变量框。,D、分别点击“统计量”、“统计图”、存储”、“选项”按钮次级对话框点击所需统计量复选框(尽量选择系统默认选项)按“继续”按钮返回主对话框。,统计量对话框:,图形对话框:,选项对话框:,存储对话框:,E、在主对话框中按“确定”按钮产生结果(见下图)。,ANOVA,b,3.344,1,3.344,43.390,0.000,a,.848,11,7.708E-02,4.192,12,Regression,Residual,Total,Model,1,Sum of,Squares,df,Mean Square,F,

42、Sig.,Predictors: (Constant), 体重,a.,Dependent Variable: 心脏横径,b.,Coefficients系数表,a,4.212,.723,5.828,.000,0.204,.031,0.893,6.587,.000,(Constant),体重,Model,1,B,Std. Error,Unstandardized,Coefficients,Beta,Standardi,zed,Coefficie,nts,t,Sig.,Dependent Variable: 心脏横径,a.,回归方程显著性检验:,回归方程:Y=0.204X+4.212,第四讲 SPS

43、S的双变量关系描述统计(二) 列联与卡方分析,1、变量关系概述 寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。 在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。,1、X2 检验 X2检验相关计算公式: X2基本公式: X2(AT)2/T 四格表专用公式: T 5 且N 40 X2(ad-bc)2n/(a+b)(c+d)(a+c)(b+d) 四格表校正公式: 当 1T5且N40 X2(ad-bc-n/2)2n/(a+b)(c+d)(a+

44、c)(b+d) 自由度: (R-1)(C-1) R行、C列 理论值: TijnR(nCn),性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。 自变量的不同取值在因变量上无差异,两变量无关。 自变量的不同取值在因变量上有差异,两变量有关。,表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。,2、双变量关系的统计类型,3、列联统计 3-1 列联表的格式,自变量,因变量,人数,行百分比,列百分比,总百分比,3-2 列联分析的原理: 自变量发生变化,因变量取值是否也发生变化。 比较边缘

45、百分比和条件百分比的差别。,4-1) 变量关系强度的含义: 指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 B)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量的变化来解释。,4 列联变量的关系强度测量,4-2) 双变量关系强度测量的主要指标,4-3)卡方测量的原理: 卡方测量用来考察两变量是否独立(无关)。 其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。,在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变

46、量有关,或,两变量不独立。,示例,由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下: 卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2 )两种。,4-4) 的改进标准化系数: 为使 值有一固定的区间,便于比较,采用了以下几个修正:,A、系数(Phi): (01), 适用于22表。 B、 列联系数(Contingency Coefficient): (01),适用任意表。 C、 Cramer V系数:(01),适用任意表。 D、系数(Lambda): (01

47、),适用任意表。 E、 Goodman & Kruskal-tau系数: (01),适用任 意表。,5 列联统计命令: StatisticsSummarizeCrosstabs,例6、四格表资料的X2检验 某医师对性乱者和献血员分别检测抗HCV,结果见下表,试问两组抗HCV检测阳性率是否有差别? 分 组 阳性 阴性 合计 阳性率(%) 性乱者 18(a) 190(b) 208 8.65 献血员 2(c) 105(d) 107 1.87 合 计 20 295 315 6.35 本例的四个理论值均大于5,应采用基本公式或专用公式。,A、数据录入。,B、资料data观察值加权weight cases

48、 产生次级对话框 (原始数据表不需要加权!)。,点击“加权”项目把“频数”送进加权变量框按“确定”按钮。,数据录入格式:,C、分析Analyze描述性统计Descriptive Statistics 交叉表Crosstabs 主对话框。,D、把行送进上变量框把列送进直行变量框。,E、按“统计量”、“格”、“格式”按钮次级对话框对需要的项目进行选择按“继续”按钮返回主对话框。,选择卡方统计量:,选择实际值和行的百分比:,列联表:,F、在主对话框中按“确定”按钮产生结果(见下图)。,Chi-Square Tests,5.470,b,1,.019,4.388,1,.036,6.602,1,.010,

49、.026,.013,315,Pearson Chi-Square,Continuity Correction,a,Likelihood Ratio,Fishers Exact Test,N of Valid Cases,Value,df,Asymp. Sig.,(2-sided),Exact Sig.,(2-sided),Exact Sig.,(1-sided),Computed only for a 2x2 table,a.,0 cells (.0%) have expected count less than 5. The minimum expected count is 6.79。,b

50、.,上表是卡方检验结果(注意结果的应用条件):,例7、四格表资料的X2 检验(校正公式): 某医院进行肿瘤手术切除分析,资料见下表,试问两组切净率是否有差别? 肿瘤性质 切净例数 残留例数 合计 切净率(%) 良 性 26(18.44) 1(8.56) 27 96.30 恶 性 2( 9.56) 12(4.44) 14 14.29 合 计 28 13 41 6.35 分析:本例一个理论值均小于5,应采用四格表校正公式。 操作方法:与例题6完全一样,不在重复(下同)。,数据录入格式:,Chi-Square Tests,28.636,b,1,.000,24.974,1,.000,31.183,1,

51、.000,.000,.000,41,Pearson Chi-Square,Continuity Correction,a,Likelihood Ratio,Fishers Exact Test,N of Valid Cases,Value,df,Asymp. Sig.,(2-sided),Exact Sig.,(2-sided),Exact Sig.,(1-sided),Computed only for a 2x2 table,a.,1 cells (25.0%) have expected count less than 5. The minimum expected count is 4

52、.44。,b.,列联表:,卡方检验结果:,例8、四格表资料确切概率法: (T1或N 40) 某医师对20例急性心机梗死并发休克患者分别采用西药和中西药结合方法抢救,结果如下表,试问两组疗效有无差别? 分 组 有效 无效 合计 有效率(%) 西 药 6(8.25) 5(2.75) 11 54.55 中西药 9(6.75) 0(2.25) 9 100.00 合 计 15 5 20 75.00 本例 N 40,应采用四格表确切概率法(Fisher法)。,数据录入格式:,Chi-Square Tests,5.455,b,1,.020,3.300,1,.069,7.335,1,.007,.038,.03

53、0,20,Pearson Chi-Square,Continuity Correction,a,Likelihood Ratio,Fishers Exact Test,N of Valid Cases,Value,df,Asymp. Sig.,(2-sided),Exact Sig.,(2-sided),Exact Sig.,(1-sided),Computed only for a 2x2 table,a.,2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.25。,b.,列联表:,

54、卡方检验结果:,例9、R C 列联表的X2 检验 某地区观察吡嗪磺合剂预防疟疾复发的效果结果,用乙胺嘧啶和不用药组作对照,结果如下表,问三组的疟疾复发率是否有差别? 分 组 复发数 未复发数 合 计 复发率% 吡嗪磺合剂 76 1920 1996 3.81 乙胺嘧啶组 27 446 473 5.71 不用药组 53 431 484 10.95 合 计 156 2797 2953 5.28 ,数据录入格式:,Chi-Square Tests,39.923,a,2,.000,33.818,2,.000,2953,Pearson Chi-Square,Likelihood Ratio,N of Va

55、lid Cases,Value,df,Asymp. Sig.,(2-sided),0 cells (.0%) have expected count less than 5. The,minimum expected count is 24.99。,a.,列联表:,卡方检验结果表,六、非参数检验:秩和检验 1、配对资料对比的秩和检验(Wilcoxon法): 例10: 对9个水样分别采用重量法和硬度联合测定EDTA法测定其硫酸含量,结果如下表,试问两种方法所得结果有无差别? 分析:本资料呈明显偏态分布。,水样号 EDTA法 重量法 差值d 秩次 (1) (2) (3) (4)=(2)(3) (5

56、) 1 115.3 115.3 0 2 355.4 354.0 1.4 4 3 336.2 337.5 1.3 3 4 215.2 222.3 7.1 8 5 159.5 156.4 3.1 5 6 57.6 56.6 1.0 2 7 59.5 58.7 0.8 1 8 653.2 658.6 5.4 6 9 1786.7 1792.6 5.9 7 -24,12,A、分析Analyze非参数检验Nonparametric Tests 两个相关样本检验 2 Related Samples 主对话框。,C、把两个变量送入检验变量框选定Wilcoxon检验复选框。,D、点击“选项”按钮次级对话框点击

57、描述性统计量复选框按“继续”按钮返回主对话框。,Test Statistics,b,-.840,a,.401,Z,Asymp. Sig. (2-tailed),总量法 - EDTA法,Based on negative ranks.,a.,Wilcoxon Signed Ranks Test,b.,E、在主对话框中按“确定”按钮产生结果(见下图)。,上表是描述性统计结果,下表是秩和检验结果。,Ranks秩(等级),4,a,3.00,12.00,4,b,6.00,24.00,1,c,9,Negative Ranks,Positive Ranks,Ties,Total,总量法 - EDTA法,N,

58、Mean Rank,Sum of Ranks,a.总量法 EDTA法 c. EDTA法 = 总量法,上表是等级比较表。,2、两样本资料对比的秩和检验: 例11:多毛症患者与对照组血清睾酮含量(ng%)的数据如下表,试检验两组血清睾酮含量值有无差别? 分析:本资料呈明显偏态分布且两组方差不齐性。 多毛症组 对照组 血清睾酮含量 秩次 血清睾酮含量 秩次 74.6 10 45.8 6 60.7 8 30.2 2 65.6 9 24.8 1 99.4 12 33.7 3 133.8 14 36.6 4 118.3 13 60.5 7 83.0 11 42.5 5 n28 T282 n16 T123,

59、A、数据录入。 B、分析Analyze非参数检验Nonparametric Tests 两个独立样本检验 2 Independent Samples 主对话框。,C、把血清睾酮送入检验变量框把分组送入分组变量框定义组别选定Mann-Whitney U 统计量复选框。,D、点击“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。,Descriptive Statistics描述性统计结果,14,64.9643,33.6282,24.80,133.80,14,1.43,.51,1,2,血清睾酮,分组,N,Mean,Std.,Deviation,Minimum,Maximum,R

60、anks秩(等级),8,10.25,82.00,6,3.83,23.00,14,分组,多毛症组,对照组,Total,血清睾酮,N,Mean Rank,Sum of Ranks,E、在主对话框中按“确定”按钮产生结果(见下图)。,下表是秩和检验结果:,Test Statistics,b,2.000,23.000,-2.840,.005,.003,a,Mann-Whitney U,Wilcoxon W,Z,Asymp. Sig. (2-tailed),Exact Sig.2*(1-tailed Sig.),血清睾酮,Not corrected for ties.,a.,Grouping Variable: 分组,b.,下表是秩和检验结果:,6、计数资料有等级顺序样本的秩和检验: 例12:根据下表资料比较两组婴儿肝炎患者的血清胆红素(mg%)含量有无差别? 本例属于列为有序变量资料,不能用R*C表卡方检验。,定义变量名称:,行变量(分组)的标签值,列变量(含量)的标签值,数据录入格式,资料data观察值加权weight cases产生次级对话框。,点击“加权”项目把“人数”送进加权变量框按“确

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!