定量资料的统计描述解析课件

上传人:文**** 文档编号:173177958 上传时间:2022-12-09 格式:PPT 页数:30 大小:161KB
收藏 版权申诉 举报 下载
定量资料的统计描述解析课件_第1页
第1页 / 共30页
定量资料的统计描述解析课件_第2页
第2页 / 共30页
定量资料的统计描述解析课件_第3页
第3页 / 共30页
资源描述:

《定量资料的统计描述解析课件》由会员分享,可在线阅读,更多相关《定量资料的统计描述解析课件(30页珍藏版)》请在装配图网上搜索。

1、定量资料的统计描述定量资料的统计描述 统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.第一节第一节 频数分布表与频数分布图频数分布表与频数分布图频数分布表频数分布表用于反映各变量(观察单位的某种特征)值及其相应频数之间关系的一类表格,我们称之为频数表.这里频数指对一种变量在多个观察单位中进行多次观察,其中某一变量值重复出现的次数.不同的资料类型编制频数表难易程度不同,其中计数资料和等级资料比较简单,而计量资料相对较繁杂些.计量资料频数表的编制计量资料频数表的编制 一般情况下,样本含量小于30的统计资料无须编

2、制频数表,但对于大样本含量的资料,编制频数表有利于进一步的统计分析、且频数表本身也具有统计描述的作用.求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数选 极差即最大值与最小值之差 一般 815 之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,最后一组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。根据变量值大小把各观察单位归入各个组段 编制频数表的步骤编制频数表的步骤编制频数表步骤流程图编制频数表步骤流程图举例说明计量资料频数表的编制过程举例说明计量资料频数表的编制过程 某地 13 岁女孩 118 人的身高(cm)资料 151.3 134.1

3、 143.7 144.9 152.2 145.0 146.4 141.2 143.3 156.3 142.0 141.3 142.5 145.5 149.5 141.1 150.6 140.9 147.2 144.8 144.5 139.8 145.7 139.3 144.8 147.5 140.5 139.9 135.4 148.5 139.1 144.5 138.5 146.2 146.8 142.3 150.9 145.5 138.1 147.1 143.8 140.5 138.5 145.2 146.8 148.9 151.8 145.6 138.1 148.1 143.9 141.5

4、 160.8*155.2 138.9 140.9 150.7 148.6 137.9 148.1 135.4 147.8 139.9 148.7 139.5 140.6 144.5 142.9 129.4*143.5 142.1 149.8 154.6 148.7 153.2 146.5 132.5 146.8 148.6 145.0 136.5 145.0 144.6 137.5 143.5 150.0 143.5 146.5 149.8 143.1 143.3 157.6 143.7 146.7 139.2 142.6 143.5 131.5 135.5 149.8 135.4 149.8

5、 138.9 152.3 141.8 150.8 146.3 142.5 147.5 136.1 141.2 146.4 143.8 149.5 147.5 140.3 138.5 142.5 步骤如下:步骤如下:!R=160.8-129.4=31.4。!组段数=10;组距=R/10=3.1430(cm);按要求确定每一组段上下限。!分组统计每一组段的频数,编制频数表。118 例 13 岁女孩身高(cm)资料频数表。身高组段 频数 组中值(1)(2)(3)129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 1

6、45.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合计 118 计量资料频数分布表计量资料频数分布表 计量资料频数分布图计量资料频数分布图 身高160.0158.0156.0154.0152.0150.0148.0146.0144.0142.0140.0138.0136.0134.0132.0130.020100Std.Dev=5.46 Mean=144.3N=118.00频数分布表的用途频数分布表的用途Z揭示数值变量频数分布的类型和特征 Z作为陈述资料的形式Z便于发现一些特大或特小的可疑值Z便于进一步的统

7、计分析 分布特征分布特征 集中趋势:集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势 离散趋势:离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都有频数分布,而不是所有频数分布在集中位置的趋势。分布类型分布类型 对称分布:对称分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少 计量资料频数分布的类型和特征计量资料频数分布的类型和特征 第二节 集中趋势的描述指标 1、算术平均数(arithmetic mean)(1)直接法 nxxxnxXnnii 211 (2)加权法 又称频数表法,适用于频数表资料。当观

8、察例数较时用。kkkkiiikiifffxfxfxffxfX 21221111 2、几何平均数(geometric mean)几何平均数用符号 G 表示。用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。医学上常用于表示类似抗体滴度等呈倍数关系的等比级数资料。1)直接法 nxnxxxxxxGniinnn1121121lglglglglglg 例 有 6 份血清的抗体效价分别为 1:10,1:20,1:40,1:80,1:160,1:320,求平均抗体效价。为便于计算,可先将抗体效价取倒数,将效价倒数代入公式,得 G=(lg10+lg20+lg40+lg80+lg160+lg320)

9、/6=(1.7526)=56.57 6 份血清的平均抗体效价为 1:56.57 (2)加权法 又称频数表法,当观察例数 n 较大时,可先编制频数分布表,用此法计算几何平均数 kiikiiifxfG111lglg 例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏和第(2)栏,求平均抗体滴度。表 100 名受试者平均抗体滴度计算表 抗体滴度 频数f 滴度倒数 X lgX flgX(1)(2)(3)(4)(5)=(2)(4)1:4 6 4 0.6021 3.6126 1:8 10 8 0.9031 9.0310 1:16 16 16 1.2041 19.2656 1:32 34 3

10、2 1.5051 51.1734 1:64 20 64 1.8062 36.1240 1:128 8 128 2.1072 16.8576 1:256 5 256 2.4082 12.0410 1:512 1 512 2.7093 2.7093 合计 100-150.8145 k1iik1iii1fxlgflgG=(150.8145/100)=(1.5081)=32.2 100 名受试者平均抗体滴度为 1:32.2。3、百分位数(percentile)与中位数(median)百分位数是一种位置指标,用符号Px表示常用的百分位数有P2.5,P5,P25,P50,P75,P95,P97.5等,其中

11、P25,P50,P75又称为四分位数。百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。中位数是一个特定的百分位数即P50,用符号M表示。把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。中位数理论上可用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。其计算方法有直接法和频数表法两种。(1)直接法 当观察例数 n 不大时,此法常用。先将观察值按大小顺序排列,选

12、用下列公式求 M。当 n 为奇数时 M=X(n+1)/2 当 n 为偶数时 M=2122nnXX 例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8,10,18,求它们的中位数。本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算得 M=2XX12n2n =X4+X5/2=(4+7)/2=5.5(天)(2)频数表法 当观察例数n较多时,可先编制频数表,再通过频数表计算中位数。公式为:M=Lm+i/fm(n50%-fL)例 现有187例某种沙门氏菌食物中毒病人的潜伏期(小时),见表第(1)栏、第(2)栏,求中位数。表 187 例某种沙门氏菌食物中毒潜伏期(小时)分布 潜伏期

13、(小时)频数 f 累计频数f (1)(2)(3)0-35 35 12-70 105 24-40 145 36-23 168 48-12 180 60-6 186 72-84 1 187 M=12+12/70(18750%-35)=22.0(小时)中位数M即第50百分位数P50,故百分位数Px的计算类似M,计算公式为:Px=Lx+i/fx(nx%-fL)例 求上表资料的P2.5,P25,P75。本例n=187,因1872.5%=4.675,18725%=46.75,18775%=140.25,结合表第(3)栏累计频数可知P2.5,P25,P75分别在“0-”,“12-”,“24-”组段内,P2.

14、5=0+12/35(1872.5%-0)=1.6(小时)P25=12+12/70(18725%-35)=14.0(小时)P75=24+12/40(18775%-105)=34.6(小时)第三节 离散趋势的描述指标 1、全距(range)计算公式为:R=XmaxXmin 全距越大,说明变量的变异程度越大。其度量单位与原变量单位相同。2、四分位数间距(quartile)是一组数值变量值中上四分数(即P75,记为Qu)与下四分数(即P25,记为QL)之差,用符号QR表示 计算公式为:QR=P75-P25 它一般和中位数一起描述偏态分布资料的分布特征。3、方差(variance)离均差平方和的算术平均数,即为方差。总体方差用符号2(读seigama)表示,样本方差用S2表示。计算公式分别为:NxNii1221122nXxSnii 4、标准差(standard deviation)方差的平方根即为标准差。总体标准差用表示,样本标准差用S表示。计算公式分别为:NxN1i2i 11121212nnxxnXxSniniiinii

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!