ChSAS基本统计过程二实用实用教案

上传人:牛*** 文档编号:90152849 上传时间:2022-05-14 格式:PPT 页数:24 大小:564KB
收藏 版权申诉 举报 下载
ChSAS基本统计过程二实用实用教案_第1页
第1页 / 共24页
ChSAS基本统计过程二实用实用教案_第2页
第2页 / 共24页
ChSAS基本统计过程二实用实用教案_第3页
第3页 / 共24页
资源描述:

《ChSAS基本统计过程二实用实用教案》由会员分享,可在线阅读,更多相关《ChSAS基本统计过程二实用实用教案(24页珍藏版)》请在装配图网上搜索。

1、2. TABLES request(s) ; TABLES语句是该过程中非常重要的一条语句。在一个PROC FREQ过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中( jzhng)的每个变量都生成一个单向频数表; 如果tables语句没有任何说明选项(options),FREQ对tables语句中规定的变量的每个水平将计算频数、累计频数、占总频数的百分数及累计百分数。第1页/共23页第一页,共24页。在TABLES语句中,用request(s)指定制表要求。这里,可以是用*连接起来的一个变量或多个变量。在一个TABLES语句中可以给出任意多个制表要求。 例

2、如(lr): 。Tables a; 对指定变量a产生一个单向频数表; 。Tables a*b; 产生以b为列、a为行的二维列联表; 。Tables a*b*c; 产生以c列、b为行、a为分层的三维列联表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(b c);等价于tables a*b a*c; 。Tables (a b)*(c d);等价于tables a*c a*d b*c b*d; 。Tables (a b c)*d;等价于tables a*d b*d c*d;第2页/共23页第二页,共24页。2) 在TABLES语句的斜杠(/)后面可以使用如下选项:CHISQ:

3、要求(yoqi)进行卡方检验(Chi-Square Test)Fisher:要求(yoqi)对大于22的表进行Fisher的精确检验;Agree:做配对卡方检验;ALPHA=p:确定置信区间的水平是100(1-p)%的置信区间,默认p=0.05;ALL:要求(yoqi)所有由CHISQ、MEASURES和CMH选项给出的检验和度量;NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER。第3页/共23页第三页,共24页。3. WEIGHT variable; 通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句时,每个观测对频数计数的贡献为这

4、个观测对应的权数(qunsh)变量的值。 。如果资料是最原始的形式,通常情况下不需要此语句; 。如果资料是以频数的形式出现,则需要该语句。 Data a;Input row col f;Cards;1 1 741 2 512 1 56 2 2 19;Run;+-甲组7451乙组5619四格(s )表资料 建立SAS数据集,行变量row,列变量col,行列(hng li)交叉对应的频数f第4页/共23页第四页,共24页。 row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 1 | 1 | 2 | 25.0

5、0 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ 2 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ Total 2 2 4 50.00 50.00 100.00 row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 74 | 51 | 125 | 37.00 | 25.50 | 62.50 | 59.20 | 40.80 |

6、 | 56.92 | 72.86 | -+-+-+ 2 | 56 | 19 | 75 | 28.00 | 9.50 | 37.50 | 74.67 | 25.33 | | 43.08 | 27.14 | -+-+-+ Total 130 70 200 65.00 35.00 100.00Proc freq data=a;Tables row*col;Weight f;Run;产生(chnshng)结果如下:Proc freq data=a;Tables row*col;Run;产生(chnshng)结果如下:无weight语句(yj)可见,有无weight语句对结果产生很大的差异,对于该资料,

7、由于是频数资料,因此一定要加上weight语句。第5页/共23页第五页,共24页。例4-8:频数表的编制 某年某地149名成人脉博资料(次/分)的测定(cdng)数据如下:试作频数表。 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71

8、 77 70 95 54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81 为了编制频数表并作频数分析,首先需要建立一个数据集,将所有的数据进行分组,然后在此基础上调用相应的SAS过程(FRE

9、Q过程)来达到我们的目的。 下面给出相应的程序:第6页/共23页第六页,共24页。建立( jinl)SAS数据集Data ex49; Input x ;Cards; 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71 77 70 95

10、54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81;Run;第7页/共23页第七页,共24页。Data ex491; Set ex49; grp=int(x-45)/5)*5+45;Run

11、;int()取整函数(hnsh)int(1.7)=1int(5.2)=5int(0.4)=0确定确定(qudng)起始分组和组距:起始分组和组距: 组距:组距:5, 起始分组:起始分组:45 - 50grp=int(x-45)/5)*5+45; 语句将每一个脉搏值进行分组,例如脉语句将每一个脉搏值进行分组,例如脉搏搏82,被分入,被分入grp=int(82-45)/5)*5+45=int(7.4)*5+45=80,即即80-85组内。组内。提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后,在提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后,在FREQ过程中对原始过程中对

12、原始(yunsh)变量变量x应用分组格式即可。应用分组格式即可。利用表达式对数据进行分组第8页/共23页第八页,共24页。分组分组 频数频数(pn sh) 百分比百分比 累积频数累积频数(pn sh) 累积百分比累积百分比 Cumulative CumulativeGrp Frequency Percent Frequency Percent- 45 1 0.67 1 0.67 50 5 3.36 6 4.03 55 12 8.05 18 12.08 60 13 8.72 31 20.81 65 27 18.12 58 38.93 70 29 19.46 87 58.39 75 23 15.4

13、4 110 73.83 80 16 10.74 126 84.56 85 9 6.04 135 90.60 90 7 4.70 142 95.30 95 5 3.36 147 98.66100 2 1.34 149 100.00Proc freq data=ex491;Tables grp;Run;对分组变量对分组变量grp进行频数分析,进行频数分析,产生以下产生以下(yxi)结果:结果:第9页/共23页第九页,共24页。Proc gchart data=ex491; /*调用gchart过程*/ hbar x /space=0 /*生成直方图,直条间无空隙(kngx)*/ midpoints

14、=47.5 to 102.5 by 5 /*直条对应的组中值*/ freq cfreq percent cpercent ; /*输出统计量*/ Run;如果要将上面的频数如果要将上面的频数(pn sh)表以频数表以频数(pn sh)图的形式表达出来,可以使用如下程序:图的形式表达出来,可以使用如下程序:关于关于gchart过程过程(guchng),感兴趣的同学可以在,感兴趣的同学可以在SAS命令框里输命令框里输入入“help gchart”并回车得到帮助。并回车得到帮助。第10页/共23页第十页,共24页。第11页/共23页第十一页,共24页。例例4-9 某研究人员收集某研究人员收集(shu

15、j)了婴儿的相关资料,试进行描述性分析了婴儿的相关资料,试进行描述性分析1=有1=手术1=母乳1=高2=无2=顺产2=牛奶2=中3=混合3=差编号小孩腹泻 腹泻次数 小孩体重 分娩方式 喂养方式 母亲年龄 教育程度1202750213122123390112723203200112814203150112815112550222337123050112619123550123011020290021281111343501232112203200132921320310011353141227501129115203050112711612300011242171132502136218203

16、250112911920340012252202036002129321132900123022211320022353232032001133124133300112622520360011261第12页/共23页第十二页,共24页。分析分析(fnx)内容内容一维表小孩腹泻发生比例是多少?发生次数怎样?分娩方式:手术产和顺产比例分别是多少?喂养方式构成?(母乳、牛奶、混合(hnh))交叉表不同喂养方式的腹泻发生率怎样?分娩方式 与喂养方式有无关联?第13页/共23页第十三页,共24页。建立SAS数据集通过excel直接导入SAS,注意第一行为SAS变量名将数据保存(bocn)在txt文本文件

17、中,通过infile读入Data a; infile c:aa.txt; Input no fx fxcs tz fm wy nl jy; label no =编号fx =小孩腹泻 fxcs=腹泻次数tz =小孩体重 fm =分娩方式 wy =喂养方式 nl =母亲年龄 jy =教育程度; Run;第14页/共23页第十四页,共24页。分析程序Proc freq data=a; table fx fxcs fm wy; Run;Proc freq data=a; table fxcs; where fx=1; Run;Proc freq data=a; table wy*fx ; table

18、fm*wy/chisq;Run;第15页/共23页第十五页,共24页。结果结果(ji gu) 略第16页/共23页第十六页,共24页。例4-10. 用抗凝剂与不用抗凝剂治疗急性心肌梗塞的疗效(lioxio)比较,结果如下表:组别生存死亡合计不用抗凝剂7451125用抗凝剂561975合计13070200请比较两种治疗(zhlio)方法的生存情况是否相同?第17页/共23页第十七页,共24页。DATA ex410;INPUT g1 g2 f;CARDS;1 1 74 1 2 512 1 56 2 2 19;PROC FREQ DATA=ex410;TABLES g1*g2/chisq Fishe

19、r;WEIGHT f;RUN;首先(shuxin)建立需要的SAS数据集调用FREQ过程,g1*g2要求生成二维表,chisq选项要求做卡方检验,fisher选项要求做fisher精确(jngqu)检验(注意对于四格表该选项可以省略);由于是频数资料,因此 加上weight语句并给出频数变量f。第18页/共23页第十八页,共24页。 g1(行变量行变量(binling) g2(列变量列变量(binling) Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 74 | 51 | 125 | 37.00 | 25.50

20、| 62.50 | 59.20 | 40.80 | | 56.92 | 72.86 | -+-+-+ 2 | 56 | 19 | 75 | 28.00 | 9.50 | 37.50 | 74.67 | 25.33 | | 43.08 | 27.14 | -+-+-+ Total 130 70 200 65.00 35.00 100.00频数频数(pn sh)百分比百分比行百分比行百分比列百分比列百分比 每一个格子中四个数据(shj)的含义第19页/共23页第十九页,共24页。 Statistics for Table of g1 by g2 统计统计(tngj)量量 自由度自由度 统计统计(t

21、ngj)量的值量的值 p值值 Statistic DF Value Prob - Chi-Square 1 4.9289 0.0264 Likelihood Ratio Chi-Square 1 5.0529 0.0246 Continuity Adj. Chi-Square 1 4.2725 0.0387 Mantel-Haenszel Chi-Square 1 4.9043 0.0268 Phi Coefficient -0.1570 Contingency Coefficient 0.1551 Cramers V -0.1570Chisq选项Chi-Square :普通卡方检验(jiny

22、n)Likelihood Ratio Chi-Square:似然比卡方检验(jinyn)Continuity Adj. Chi-Square:校正卡方检验(jinyn)Mantel-Haenszel Chi-Square : Mantel-Haenszel卡方检验(jinyn)Phi Coefficient:Phi系数Contingency Coefficient:残联系数Cramers V:克莱姆系数WARNING: 25% of the cells have expected counts less than 5. Chi-Square may not be a valid test.如果

23、有超过(chogu)1/4格子的理论数小于5,SAS会打印警告。第20页/共23页第二十页,共24页。 Fisher精确精确(jngqu)检验检验 Fishers Exact Test - Cell (1,1) Frequency (F) 74 Left-sided Pr = F 0.9918 Table Probability (P) 0.0103 Two-sided Pr = P 0.0321 Sample Size = 200Fisher选项对于四格表,chisq选项自动计算Fishers Exact Test,当大于22表时,则需要指定Fisher选项强制(qingzh)进行该检验。本

24、例双侧检验的p=0.0321.第21页/共23页第二十一页,共24页。获取获取(huq)帮助帮助SAS命令框中输入(shr): help freq 并回车第22页/共23页第二十二页,共24页。感谢您的欣赏(xnshng)!第23页/共23页第二十三页,共24页。NoImage内容(nirng)总结2. TABLES request(s) 。ALL:要求所有(suyu)由CHISQ、MEASURES和CMH选项给出的检验和度量。建立格式之后,在FREQ过程中对原始变量x应用分组格式即可。关于gchart过程,感兴趣的同学可以在SAS命令框里输入“help gchart”并回车得到帮助。分娩方式 与喂养方式有无关联。Phi Coefficient:Phi系数。感谢您的欣赏第二十四页,共24页。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!