SAS软件的统计分析系统

上传人:xins****2008 文档编号:112086240 上传时间:2022-06-22 格式:PPTX 页数:123 大小:355.74KB
收藏 版权申诉 举报 下载
SAS软件的统计分析系统_第1页
第1页 / 共123页
SAS软件的统计分析系统_第2页
第2页 / 共123页
SAS软件的统计分析系统_第3页
第3页 / 共123页
资源描述:

《SAS软件的统计分析系统》由会员分享,可在线阅读,更多相关《SAS软件的统计分析系统(123页珍藏版)》请在装配图网上搜索。

1、tatistical nalysis ystem公共卫生学院信息数据处理教学实验室 标题栏、菜单栏、工具栏标题栏、菜单栏、工具栏vPROGRAM EDITOR 程序编辑窗口vLOG 运行过程日志窗口vOUTPUT 结果输出窗口 SAS常用功能键常用功能键例:一组体检资料,包括姓名、性别、年龄、身高、体重,要例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。求分性别计算身高、体重的均数、标准差、最大值、最小值。 姓名姓名 性别性别 年龄年龄 身高身高 体重体重 ZHANGLIN F 47 156.3 47.1 ZHAOHUA M 38 1

2、72.4 61.5 WANGQANG M 41 169.2 64.5 LIULI F 52 158.2 53.6 SHIDONG F 39 160.1 48.0 KONGYING M 29 174.1 64.6 LILING F 37 152.3 42.2 GUANFEN M 32 166.2 60.2 MIAOQING M 26 180.3 74.3 NIUHUA M 31 178.2 80.2 TANGJIE F 35 169.2 60.8 GAOJUN M 24 176.0 73.3 SUNHONG F 27 158.3 49.9 DATA AA1; INPUT NAME$ SEX AG

3、E HEIGHT WEIGHT; CARDS; ZHANGLIN 2 47 156.3 47.1 ZHAOHUA 1 38 172.4 61.5 WANGQANG 1 41 169.2 64.5 LIULI 2 52 158.2 53.6 SHIDONG 2 39 160.1 48.0 KONGYING 1 29 174.1 64.6 LILING 2 37 152.3 42.2 GUANFEN 1 32 166.2 60.2 MIAOQING 1 26 180.3 74.3 NIUHUA 1 31 178.2 80.2 TANGJIE 2 35 169.2 60.8 GAOJUN 2 24

4、176.0 73.3 SUNHONG 2 27 158.3 49.9 ;PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT;RUN;v DATA STEP(数据步数据步)v PROCEDURE STEP(过程步过程步)v RUN (结束结束)1. 必须在必须在PGM窗口。窗口。SAS语句书写格式自语句书写格式自由,每个语句以由,每个语句以“;”结束,结束,可以在一行中写几个语句或一个语句写在几行中,不区分字母大小写。 2. 运行运行SAS程序程序v工具栏执行按钮v功能键“F8”( Submit )v菜单栏 Locals Submit v命令框键入“Submit”命

5、令自动激活OUTPUT窗口,出现程序运行结果3. 调试调试SAS程序程序 没出现结果窗口,或结果不理想时。v激活LOG窗口(F6) 查看运行过程及出错信息黑色文字:源程序及运行情况蓝色文字:程序运行情况说明信息红色文字:出错信息绿色文字:警告信息v激活PGM窗口(F5)v调回SAS程序 (F4)修改错误后重新发送4. 保存保存SAS程序或其他窗口内容程序或其他窗口内容 激活相应窗口激活相应窗口v常用工具栏 存盘按钮v菜单栏 File Save(或Save as)v命令框输入File命令可以分别保存程序、运行结果、日志5. 打开已保存的程序、结果等打开已保存的程序、结果等 只能在只能在PGM窗口

6、窗口v常用工具栏 打开按钮v菜单栏 File Openv命令框输入Include命令可打开以前保存的程序、运行结果、日志等文件及其他文本格式的文件。选择项有:OUT=新数据集名(缺省按DATA n自动命名)PREFIX=新变量名前缀(缺省按Col n自动命名)NAME=为原变量名列命名(缺省自动命名为_Name_)DATA AA2; INPUT X F; CARDS;2.5 5 2.7 10 2.9 12 3.1 23 3.3 24 3.5 22 3.7 17 3.9 7 4.1 3 ; PROC MEANS N MEAN STD STDERR CLM ;VAR X;FREQ F;RUN;数据

7、步中:X 是组中值,F是频数DATA AA3; INPUT X F; Y=LOG10(X); CARDS;4 1 8 5 16 6 32 2 64 7 128 10 256 4 512 5 ;PROC MEANS; VAR Y; FREQ F;OUTPUT OUT=C MEAN=M; &DATA B2; SET C ; G=10*M; #PROC PRINT DATA=B2; VAR G;*RUN;&输出临时数据集C,变量M=均数,#新建数据集B2,取自C,求反对数G=10M*输出过程步,输出几何均数 G2_)(xx 频数 构成比行构成比列构成比DATA BB; INPUT N1 X1 S1

8、N2 X2 S2; SE=SQRT(S1*S1/N1+S2*S2/N2); U=ABS(X1-X2)/SE; P1=1-PROBNORM(U); P=2*P1; U=ROUND(U,0.001); P=ROUND(P,0.00001); IF P F变异来源 自由度 SS MS F PModel模型 2 2384.02550505 1192.01275253 5.85 0.0077Error误差 27 5497.83616162 203.62356154Total总 29 7881.86166667 R-Square R2 C.V. Root MSE Sy.x X Mean 0.302470

9、12.93519 14.26967279 110.31666667Source DF Anova SS Mean Square F Value Pr F变异来源 自由度 SS MS F P G组间 2 2384.02550505 1192.01275253 5.85 0.0077 P0.01,拒绝拒绝H0,接受接受H1,可以认为三组人群载脂蛋白不同。可以认为三组人群载脂蛋白不同。_xStudent-Newman-Keuls test for variable: X均数间两两比较均数间两两比较q检验(检验(SNK法)法)Means with the same letter are not sig

10、nificantly different.相同字母表示的均数无显著性差别 SNK Grouping Mean N G A 122.800 10 3 B 105.455 11 1 B B 102.389 9 2第三组高于前两组,即健康人的载脂蛋白高于两组病人。单因素方差分析时,如只有各组的均数、标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。例:研究不同季节人体肾上腺皮质3-HSD活性变化DATA AA; INPUT K XX; DO I=1 TO K; INPUT N X S; OUTPUT; SS1+(XX-X)*(XX-X)*N;

11、 SS2+S*S*(N-1);NN+N; END; SS1=SS1/(K-1); SS2=SS2/(NN-K); F=SS1/SS2; P=1-PROBF(F,K-1,NN-K); F=ROUND(F,0.001); P=ROUND(p,0.00001); IF P FModel模型 9 2521.29375 280.14375 11.52 0.0001Error误差 14 340.54250 24.32446Total总 23 2861.83625 R-Square C.V. Root MSE X Mean 0.881006 8.860514 4.93198381 55.6625Source

12、 DF Anova SS Mean Square F Value Pr F I 处理间 2 144.9175 72.45875 2.98 0.0836 J 区组间 7 2376.37625 339.48232 13.96 0.0001处理间处理间P0.05,不拒绝不拒绝H0,尚不能认为三种营养素喂养小鼠增重有尚不能认为三种营养素喂养小鼠增重有差别;区组间差别;区组间P FModel 9 6396.5625 710.7292 4.02 0.0521Error 6 1059.8750 176.6458Total 15 7456.4375 R-Square C.V. Root MSE X Mean

13、0.857858 25.46743 13.29081763 52.1875Source DF Anova SS Mean Square F Value Pr FCX 3 773.1875 257.7292 1.46 0.3167DW 3 270.68750 90.2292 0.51 0.6894YW 3 5352.68750 1784.2292 10.10 0.0092四种药物之间PB、C。而动物之间和用药次序均无影响。DATA AA12; DO A=1 TO 2; DO B=1 TO 2; DO I=1 TO 4; INPUT X ; OUTPUT; END; END; END; CARDS

14、; 52 48 44 44 84 88 90 88 52 44 40 26 47 64 52 45;PROC ANOVA; CLASS A B; MODEL X=A B A*B;RUN;Dependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 3 5309.00 1769.67 33.39 0.0001Error 12 636.00 53.00 Total 15 5945.00 R-Square C.V. Root MSE X Mean 0.893019 12.82839 7.28 56.75Sour

15、ce DF Anova SS Mean Square F Value Pr F A 1 1764.00 1764.00 33.28 0.0001 B 1 2704.00 2704.00 51.02 0.0001A*B 1 841.00 841.00 15.87 0.0018不同方法、不同化合物间均有差别,且交互作用也有统计学意义。新法高于旧法,乙物高于甲物,以新法+乙物为最佳组合。DATA AA13; DO CX=1 TO 2; DO DW=1 TO 6; INPUT YW$ X ; OUTPUT; END; END;CARDS; Y 15 D 31 Y 17 D 30 D 25 Y 5 D

16、27 Y 25 D 28 Y 14 Y 18 D 26 ;PROC ANOVA; CLASS CX DW YW; MODEL X=CX DW YW;RUN;Dependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 7 621.5833 88.7976 5.85 0.0535Error 4 60.6667 15.1667Total 11 682.2500 R-Square C.V. Root MSE X Mean 0.911079 17.90547 3.8944 21.75Source DF Anova

17、 SS Mean Square F Value Pr FCX 1 18.75 18.75 1.24 0.3285DW 5 158.75 31.75 2.09 0.2470YW 1 444.08 444.08 29.28 0.0057药物间P0.05,不拒绝H0,尚不能认为VC有增效作用DATA BB; DO I=1 TO 2; DO J=1 TO 2; INPUT F;OUTPUT; END; END;CARDS;54 8 44 20 ;PROC FREQ; TABLES I*J/CHISQ; WEIGHT F; RUN;WEIGHT 语句指明变量 F 是频数加选项 EXACT可以对22表作F

18、isher确切概率EXPECTED可以显示每个格子的理论值CMH可以计算队列研究和病例对照研究的RR值NOROW、NOCUL、NOPERCENT 不显示相应百分数NOPRINT 不显示表格,只显示计算的统计量STATISTICS FOR TABLE OF I BY J Statistic 统计量 DF Value ProbChi-Square 2 1 6.133 0.013Likelihood Ratio Chi-Square 似然比似然比2 1 6.304 0.012Continuity Adj. Chi-Square 校正校正2 1 5.118 0.024Mantel-Haenszel C

19、hi-Square MH 2 1 6.084 0.014Fishers Exact Test 确切概率确切概率 (Left) 0.997 (Right) 0.011 (2-Tail) 0.018 Phi Coefficient (Phi系数系数) 0.221 Contingency Coefficient (列联系数列联系数) 0.215 Cramers V (克莱姆系数克莱姆系数) 0.221 Sample Size = 126由原始数据计算:由原始数据计算:如258人资料,三个定性变量A文化程度(1=文盲2=初中以下3=高中4=大学)B工作强度(1=轻 2=中 3=重)C月收入 (1=30

20、0 2=300- 3=500- 4=1000-)试分析文化程度与月收入之间的关系 DATA AA4; INPUT A B C; CARDS; 3 2 3 4 1 4 4 1 3 ; PROC FREQ; TABLES A*C/CHISQ;RUN; DATA BB; DO I=1 TO 2; DO J=1 TO 2; INPUT F;OUTPUT; END; END; CARDS; 261 87 31 31 ; PROC FREQ; TABLES I*J/AGREE; WEIGHT F; RUN;AGREE选项作定性资料的一致性检验,计算2和Kappa统计量,Kappa0.75很满意。配对四格表

21、资料计算 McNemars 2统计量配对RC表(方表)计算Bowker对称性检验QB统计量, QB近似服从DF=R(R-1)/2的2分布。当P0.05,拒绝H0时,结论为不服从对称分布。McNemars TestStatistic = 26.576 DF = 1 Prob = 0.001 Simple Kappa Coefficient 95% Confidence BoundsKappa = 0.182 ASE = 0.051 0.083 0.281Sample Size = 410P0.01,拒绝H0,接受H1,可以认为甲、乙两法的检出率不同,甲法检出率高于乙法。Kappa值的假设检验:H

22、0:Kappa=0u=Kappa/ASE=0.182/0.051=3.57 P0.05,不拒绝H0,认为该资料服从对称分布。一致性检验一致性检验:u=Kappa/Ase=13.6,P|T| 0.0575 Num = 0 8 Num 0 6 M(Sign)符号检验符号检验 2 Pr=|M| 0.2891 Sgn Rank符号秩和检验符号秩和检验 15 Pr=|S| 0.0391DATA AA15; INPUT X; G=(_N_ |Z| = 0.0034 T-Test Approx. Significance = 0.0098 Kruskal-Wallis Test (Chi-Square Ap

23、proximation)CHISQ = 8.8813 DF = 1 Prob CHISQ = 0.0029Simple StatisticsVariable N Mean Std Dev Sum Minimum Maximum Y 12 2.90 0.4144 34.83 2.20 3.50 X 12 49.33 5.2800 592.00 42.00 58.00Pearson Correlation Coefficients / Prob |R| under Ho: Rho=0 / N = 12 X Y 0.74948 r 0.0050 P 相关系数 r=0.74948 P=0.005 有高

24、度正相关关系,可以作直线回归分析。yyyAnalysis of VarianceSource DF Sum of Squares Mean Square F Value ProbFModel 1 1.06122 1.06122 12.817 0.0050Error 10 0.82800 0.08280C Total 11 1.88922 Root MSE (Sy.x) 0.28775 R-square (R2) 0.5617 Dep Mean ( ) 2.90250 Adj R-sq (校正R2) 0.5179 C.V. 9.91388 Parameter Estimates(参数估计) Pa

25、rameter Standard T for H0: ProbVariable DF Estimate b Error Sb Parameter=0 |T|INTERCEP 1 0.000413 0.8149 0.001 0.9996 X 1 0.058826 0.0164 3.580 0.0050_y例:某地29名13岁男童身高、体重、肺活量资料试分析身高、体重对肺活量是否有影响DATA AA17; INPUT X1 X2 Y; CARDS; 135.1 32.0 1.75 139.9 30.4 1.75 ;PROC CORR; VAR X1 X2 Y; 相关分析PROC REG; MODE

26、L Y=X1 X2; 多元回归分析PROC REG; MODEL Y=X1 X2/ 逐步回归分析 SELECTION=STEPWISE SLE=0.05 SLS=0.05;RUN; 用逐步法,选入、剔除变量时均为=0.05Correlation Analysis3 VAR Variables: X1 X2 Y Simple StatisticsVariable N Mean Std Dev Sum Minimum MaximumX1 29 152.59 8.36 4425.20 135.0 167.8X2 29 37.13 5.53 1076.70 27.6 49.5Y 29 2.20 0.4

27、6 63.75 1.25 3.00Pearson Correlation Coefficients / Prob |R| under Ho: Rho=0 / N = 29 X1 X2 Y X1 1.00000 0.74142 0.61045 0.0 0.0001 0.0004 X2 0.74142 1.00000 0.74961 0.0001 0.0 0.0001 Y 0.61045 0.74961 1.00000 0.0004 0.0001 0.0 身高、体重均与肺活量有正相关关系,身高和体重间 也有高度正相关关系。Analysis of Variance Sum of MeanSource

28、 DF Squares Square F Value ProbF Model 2 3.29616 1.64808 17.131 0.0001 Error 26 2.50125 0.09620C Total 28 5.79741 Root MSE 0.31016 R-square 0.5686 Dep Mean 2.19828 Adj R-sq 0.5354 C.V. 14.10945 Parameter Estimates Parameter Standard T for H0:Variable DF Estimate Error Parameter=0 Prob |T|INT 1 -0.82

29、4690 1.22675793 -0.672 0.5074X1 1 0.006612 0.01045366 0.632 0.5326X2 1 0.054246 0.01578786 3.436 0.0020 身高对肺活量的影响在方程中没有意义。Stepwise Procedure for Dependent Variable YStep 1 Variable X2 Entered R-square = 0.56191860 第1步 变量X2进入 C(p) = 1.40004825 DF Sum of Squares Mean Square F ProbFRegression 1 3.2577

30、3.2577 34.63 0.0001Error 27 2.5397 0.0941Total 28 5.7974 Parameter Standard Type IIVariable Estimate Error Sum of Squares F ProbFINT -0.0906 0.3931 0.0050 0.05 0.8194X2 0.0616 0.0105 3.2577 34.63 0.0001Bounds on condition number: 1, 1All variables left in the model are significant at the 0.0500 leve

31、l.No other variable met the 0.0500 significance level for entry into the model. 在=0.05水准上,没有变量可以进行方程。Summary of Stepwise Procedure for Dependent Variable Y Variable Number Partial ModelStep Entered Removed In R*2 R*2 C(p) F ProbF 1 X2 1 0.5619 0.5619 1.4 34.63 0.0001(3)多元回归分析多元回归分析菜单栏 Statistics Reg

32、ression Linear Y Dependent X1、X2 Independent OK(4)逐步回归分析逐步回归分析以上步骤完成后,在Model窗口选1种筛选变量的方法,在Criteria窗口可以改变选入剔除变量的检验水准 OK OKDATA AA18; INPUT T; CENSOR=(T15); T=ABS(T); CARDS; 2 3 9 10 10 -12 15 -15 16 -18 -24 30 -36 -40 -45 9 -12 16 19 -19 -20 -20 -24 -24 -30 -31 -34 -42 -44 -53 -59 -62 ;PROC LIFETEST

33、METHOD=PL PLOTS=(S); TIME T*CENSOR(1); STRATA G; RUN;加选项:METHOD=LT 指定用寿命表法估计生存率 METHOD=PL 乘积极限法估计生存率(缺省值) PLOTS=(S) 作生存率曲线 STRATA 指定分层变量Product-Limit Survival Estimates 时间 生存率 死亡率 Survival Number Number T Survival Failure Std Err Failed Left 0.00 1.0000 0 0 0 15 2.00 0.9333 0.0667 0.0644 1 14 3.00 0

34、.8667 0.1333 0.0878 2 13 9.00 0.8000 0.2000 0.1033 3 12 10.00 . . . 4 1110.00 0.6667 0.3333 0.1217 5 1012.00* . . . 5 915.00 0.5926 0.4074 0.1288 6 8 15.00* . . . 6 716.00 0.5079 0.4921 0.1354 7 618.00* . . . 7 524.00* . . . 7 430.00 0.3810 0.6190 0.1497 8 336.00* . . . 8 240.00* . . . 8 145.00* . .

35、 . 8 0 * Censored Observation *为截尾值Summary Statistics for Time Variable T Point 95% Confidence Interval Quantile Estimate Lower, Upper) 75% . 16.0000 .中位生存时间 50% 30.0000 10.0000 . 25% 10.0000 3.0000 30.0000平均生存时间 Mean 19.9704 Standard Error 3.0406 两组生存率比较 Test of Equality over Strata Pr Test Chi-Squ

36、are DF Chi-Square对数秩检验 Log-Rank 5.6049 1 0.0179 Wilcoxon 5.3379 1 0.0209 -2Log(LR) 6.3132 1 0.0120欲分析影响老年人身体和心理健康的因素1. 不同性别间老年人年龄、文化程度、婚姻状况、家庭经济、药费负担、居住、锻炼等因素的分布及身心健康状况是否相同。2. 年龄、文化程度、婚姻状况、家庭经济、药费负担、居住、锻炼等因素对身心健康的影响。3. 身体状况、生活自理能力对心理健康的影响4. 社会支持量表与信心量表的相关性分析。1. 不同性别间老年人年龄、文化程度、婚姻状况、家庭经济、药费负担、居住、锻炼等因

37、素的分布及身心健康状况是否相同。 提示:年龄和心理健康量表分是定量资料,应作t检验,其它变量均可用2检验 PROC TTEST; CLASS X1; VAR X2 X11-X16; PROC FREQ; TABLES X1*(X3-X10)/CHISQ; RUN; 经检验发现男女之间身心健康状况明显不同,很多影响因素的分布也不同,故以下部分项目的分析应该分性别进行。2. 年龄、文化程度、婚姻状况、家庭经济、药费负担、居住、锻炼等因素对身心健康的影响。分性别进行:DATA A1; SET AA; IF X1=1;(男性)定量资料如年龄与心理量表分可以用相关分析PROC CORR; VAR X2;

38、 WITH X11-X16; RUN;年龄与身体健康状况、文化程度等项目与心理量表分 可以作方差分析PROC MEANS; CLASS X10; VAR X1;PROC ANOVA; CLASS X10; MODEL X1=X10; RUN; 文化程度等项目与身体健康状况可用2检验PROC FREQ; TABLES X10*(X3-X9)/CHISQ; RUN;3. 身体状况、生活自理能力对心理健康的影响 可以作方差分析PROC MEANS; CLASS X10; VAR X11-X16;PROC ANOVA; CLASS X10; MODEL X11-X16=X10; RUN; 4. 社会支持量表与信心量表的相关性分析。 作相关分析PROC CORR; VAR X11-X13; WITH X14-X16; RUN;资料分析过程中,一要根据资料的类型选用正确的统计分析方法;二要不断的根据中间分析结果来调整下一步的分析思路。例如第一步发现了不同性别老年人的身心健康状况不同,且很多影响因素的分布也不同,所以决定下一步要分性别分析。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!