演示文稿2—平均数与标准差

收藏

编号:168153792    类型:共享资源    大小:1.14MB    格式:PPT    上传时间:2022-11-08
30
积分
关 键 词:
演示 文稿 平均数 标准差
资源描述:
1 护理本科护理本科2007级级2009年年2月月2第十章 数值变量资料的统计分析第一节 数值变量资料的统计描述第二节 正态分布与参考值范围第三节 均数的抽样误差和总体均数的估计第四节 假设检验的基本思想与步骤第五节 t 检验和 u 检验第六节 方差分析3第一节 数值变量资料的统计描述一、频数表二、描述集中趋势的指标三、描述离散趋势的指标4一 频数表(一)、频数分布表及其编制(二)、频数分布图(三)、频数分布特征5表表-1 1 某地区某地区 130130 名正常成年男子的红细胞数名正常成年男子的红细胞数(1210L)L)3.79*4.57 5.19 4.86 4.28 4.67 5.37 4.98 4.45 5.88*4.53 5.16 4.84 4.15 4.66 5.31 4.97 4.43 4.77 4.78 5.10 4.83 4.11 4.63 5.28 4.94 4.40 4.74 5.67 5.05 4.81 3.98 4.61 5.23 4.90 4.35 4.70 5.46 5.03 4.49 3.89 4.57 5.21 4.87 4.29 4.67 5.38 4.98 4.46 4.78 4.54 5.16 4.85 4.17 4.66 5.32 4.97 4.43 4.77 5.07 5.13 4.83 4.13 4.64 5.29 4.95 4.42 4.74 5.69 4.53 4.81 4.01 4.62 5.26 4.91 4.36 4.73 5.49 5.04 4.78 3.94 4.57 5.23 4.90 4.31 4.68 5.39 4.99 4.48 5.08 4.54 5.17 4.86 4.27 4.66 5.36 4.98 4.43 4.77 4.53 5.15 4.84 4.13 4.64 5.29 4.96 4.42 4.75 5.69 4.80 4.82 4.10 4.62 5.26 4.93 4.39 4.74 5.61 5.04 5.10 3.98 4.58 5.23 4.90 4.33 4.68 5.40 5.00 4.49 4.80 6表表-2 2 某地区某地区 130130 名正常成年男子红细胞数名正常成年男子红细胞数(1210L)L)的频数分布的频数分布 红细胞数红细胞数(1)划划 记记(2)频频 数数(3)3.70 丁丁 2 3.90 下下 4 4.10 正下正下 9 4.30 正正正一正正正一 16 4.50 正正正正丁正正正正丁 22 4.70 正正正正正正正正正正 25 4.90 正正正正一正正正正一 21 5.10 正正正丁正正正丁 17 5.30 正丁正丁 9 5.50 丁丁 4 5.705.90 1 合合计计 130 910 g=8 Fraction5.88*3.795.880.25384611 g=11 Fraction5.88*3.795.880.19230812 g=5 Fraction5.88*3.795.880.40769213 g=15 Fraction5.88*3.795.880.16923114(三)频数表和频数图的应用一、发现极大或极小的可疑值,以及时复查纠正。二、揭示资料的分布特点,故可作为描述资料的工具15资料的分布特点分布范围集中趋势(平均水平)离散趋势(变异程度)分布类型(看是否对称)16数值变量资料的统计描述指标集中趋势的描述集中趋势的描述 三大平均数三大平均数 均数均数 几何均数几何均数 中位数中位数 离散趋势的描述离散趋势的描述 全距全距 四分位数间距四分位数间距 方差方差 标准差标准差 变异系数变异系数17二、集中趋势指标),(xmean18表表-1 某地某地 1998 年年 110 名名 20 岁健康男大学生身高分布岁健康男大学生身高分布(cm)身高组段身高组段 频数频数 f 组中值组中值 X fX fX2 (1)(2)(3)(4)=(2)(3)(5)=(3)(4)162 1 163 163 26569 164 4 165 660 108900 166 9 167 1503 251001 168 13 169 2197 371293 170 19 171 3249 555579 172 27 173 4671 808083 174 16 175 2800 490000 176 8 177 1416 250632 178 8 179 1432 256328 180 3 181 543 98283 182184 2 183 366 66978 合合 计计 110(f)一一 19000(fx)3283646(2fx)表表-3 3 某地区某地区 130130 名正常成年男子红细胞数名正常成年男子红细胞数(10(101212L)L)的的 均数和标准差的加权计算表均数和标准差的加权计算表 红细胞数红细胞数 组中值组中值 X 频数频数 f fX fX2 (1)(2)(3)(4)=(2)(3)(5)=(2)(4)3.70 3.80 2 7.60 28.88 3.90 4.00 4 16.00 64.00 4.10 4.20 9 37.80 158.76 4.30 4.40 16 70.40 309.76 4.50 4.60 22 101.20 465.52 4.70 4.80 25 120.00 576.00 4.90 5.00 21 105.00 525.00 5.10 5.20 17 88.40 459.68 5.30 5.40 9 48.60 262.44 5.50 5.60 4 22.40 125.44 5.705.90 5.80 1 5.80 33.64 合合 计计 一一 130 623.20 3009.12 20均数的应用均数的应用 均数常用于反映一组观察值的平均数量均数常用于反映一组观察值的平均数量水平。但只水平。但只适用于对称分布资料,尤其适用于对称分布资料,尤其是正态分布资料或近似正态分布资料是正态分布资料或近似正态分布资料。对明显不对称(偏态)资料或分布不明对明显不对称(偏态)资料或分布不明资料应选用其它平均数指标。资料应选用其它平均数指标。212223 补充题:35名麻疹患儿接种疫苗一个月后,血凝抑制抗体滴度见下表,求平均滴度。24抗体滴度人数滴度倒数XlgXflgX(1)(2)(3)(4)(5)=(2)(4)1:4140.60210.60211:8480.90313.61241:165161.20416.02051:324321.50516.02041:646641.806210.83721:12891282.107218.96481:25642562.408217.63281:51225122.70935.4186合计合计3569.10882526几何均数的应用几何均数的应用(1)几何均数主要用于下述偏态分布资料:几何均数主要用于下述偏态分布资料:对对数正态分布资料、等比资料数正态分布资料、等比资料,如抗体滴度、,如抗体滴度、平均效价、发展速度等。用以说明平均增平均效价、发展速度等。用以说明平均增减的倍数、平均发展速度。此类资料不宜减的倍数、平均发展速度。此类资料不宜计算均数。计算均数。(2)观察值中不能有观察值中不能有 0。(3)观察值中不能同时有正数或负数。观察值中不能同时有正数或负数。27中位数(中位数(median,M)与)与百分位数(百分位数(percentile,Px)中位数计算方法:中位数计算方法:1.1.原始资料:原始资料:x(n+1)/2 n 为奇数时为奇数时 M=xn/2+x(n/2+1)/2 n 为偶数时为偶数时 28例例10.5 某某传传染染病病患患者者9人人,他他们们发发病病的的潜潜伏伏期期分分别别为为:4、4、5、5、6、7、7、9、12天天,求求中中位位数数。n=9 M=x(n+1)/2=x(9+1)/2=x5=6(天天)例例10.6 若若上上例例又又增增加加1例例潜潜伏伏期期为为20天天的的患患者者,求求中中位位数数。n=10 M=xn/2+x(n/2+1)/2=x10/2+x(10/2+1)/2 =x5+x 6/2=6+7/2=6.5(天天)2930表表 7-3 164 名食物中毒患者潜伏期的中位数和百分位数名食物中毒患者潜伏期的中位数和百分位数 预防医学(三版)预防医学(三版)109 页页 潜伏期(小时)潜伏期(小时)频数频数 f 累计频数累计频数f 累计频率累计频率(%)(1)(2)(3)(4)=(3)n 0 25 25 15.2 12 58 83 50.6 24 40 123 75.0 36 23 146 89.0 48 12 158 96.3 60 5 163 99.4 7284 1 164 100.0 313233 中位数的应用中位数的应用 偏态分布资料;偏态分布资料;分布不明或不规则;分布不明或不规则;有极大值或极小值;有极大值或极小值;开口资料(因其不受两端数据的影开口资料(因其不受两端数据的影 响,故在上述状况时较稳定)响,故在上述状况时较稳定)34百分位数的应用百分位数的应用百分位数用于描述样本或总体观察值百分位数用于描述样本或总体观察值序列在某百分位置的水平。较常用的百分序列在某百分位置的水平。较常用的百分位数有:位数有:P50(中位数)、(中位数)、P2.5、P5、P95、P97.5。这些百分位数常用来确定偏态分布资这些百分位数常用来确定偏态分布资料的医学参考值范围;料的医学参考值范围;P25、P75用来描述用来描述数据的变异。数据的变异。35百分位数的应用注意百分位数的应用注意 分布在中部的百分位数较稳定,具有分布在中部的百分位数较稳定,具有较好的代表性;较好的代表性;靠近两端的百分位数只有在例数较多靠近两端的百分位数只有在例数较多时才比较稳定。时才比较稳定。因此,若样本含量不够大时,不宜计因此,若样本含量不够大时,不宜计算太靠近两端的百分位数。算太靠近两端的百分位数。36三、离散趋势指标 1.28 29 30 31 32 2.10 20 30 40 50 3.10 28 30 32 50 301x 5811.11s 302x 8113.152s 303x 2126.143s 37 ix;0)(ix 2)(ix 离均差离均差 离均差和离均差和 离均差平方和离均差平方和 变异度大变异度大 离均差平方和大离均差平方和大 N N 大大 Nxi2)(2 2,称总体方差,已扣除,称总体方差,已扣除 N N 的影响,只反映变异度的的影响,只反映变异度的大小。大小。Nxi2)(=即为即为总体标准差总体标准差(d de ev vi ia at ti io on n)38用用 2i)xx(2i)x(,以,以 n N,得,得 n)xx(2i 。1n)xx(s2i2 样本方差样本方差 1nxxs2i 样本标准差样本标准差 式中式中 n n-1 1 称为自由度,用希腊字母“称为自由度,用希腊字母“”表示。”表示。39计算公式:计算公式:1nn/xxs22 用于原始资料用于原始资料.或或 1/22 fffXfXs 用于频数表资料用于频数表资料。注意注意:上上式中“式中“X”指组中值。”指组中值。40 计算实例计算实例求表求表 7-1 中中 110 名名 20 岁健康男岁健康男大学生身高的标准差。大学生身高的标准差。据表据表 7-1 可算得,可算得,fx=19000,fx2=3283646,故,故 095411101101900032836462./1-ff/fx-fxs22 41 标准差的应用:标准差的应用:1反映变异程度的大小,反映变异程度的大小,s 愈小,变异度愈小,愈小,变异度愈小,均数的代表性愈好;反之则差。均数的代表性愈好;反之则差。2计算标准误,估计抽样误差的大小(详见后)。计算标准误,估计抽样误差的大小(详见后)。3计算变异系数。计算变异系数。4结合均数与正态分布理论,估计参考值范围。结合均数与正态分布理论,估计参考值范围。*标准差的性质:标准差的性质:若若 n ,则,则 s 稳定。稳定。42例:试比较下述三组资料的变异程度。例:试比较下述三组资料的变异程度。1.1.测得测得 19851985 年全国汉族城市儿童少年(男)年全国汉族城市儿童少年(男)身高(身高(cmcm)、)、体重(体重(kgkg)资料如下:)资料如下:指标指标 x s s 身高身高 121.38 5.22 体重体重 21.52 2.82 2.2.同一批同一批 7 7 岁男童,岁男童,身高(身高(cmcm)资料如下)资料如下 组别组别 x s s 7 7 岁组岁组 121.38121.38 5.225.22 2020 岁组岁组 170.26170.26 5.705.70 43四、变异系数(四、变异系数(coefficient of variation CV)计算公式计算公式%100 xsCV 由于由于x与与 s 单位相同,所以,单位相同,所以,CV 无单位。无单位。441.1.测得测得 19851985 年全国汉族城市儿童少年(男)身高(年全国汉族城市儿童少年(男)身高(cmcm)资料如下)资料如下 组别组别 x s s CV(%)CV(%)7 7 岁组岁组 121.38121.38 5.225.22 4.304.30 2020 岁组岁组 170.26170.26 5.705.70 3.353.35 2.2.同一批同一批 7 7 岁男童,身高(岁男童,身高(cmcm)、体重()、体重(kgkg)资料如下:)资料如下:指标指标 x s s CV(%)CV(%)身高身高 121.38121.38 5.225.22 4.304.30 体重体重 21.5221.52 2.822.82 13.1013.10 3.同一批同一批 7 岁男童,身高(岁男童,身高(cm)、坐高()、坐高(cm)资料如下:)资料如下:指标指标 x s s CV(%)CV(%)身高身高 121.38121.38 5.225.22 4.304.30 胸围胸围 57.6857.68 2.992.99 5.185.18 45*变异系数的应用:变异系数的应用:1.单位不同的资料间比较单位不同的资料间比较 2.均数相差悬殊的资料间比较均数相差悬殊的资料间比较46第二节第二节 正态分布和医学参考正态分布和医学参考 值范围值范围 一、正态分布的概念一、正态分布的概念 二、正态分布图形二、正态分布图形 三、正态分布的特征三、正态分布的特征 四、正态曲线下面积的分布规律四、正态曲线下面积的分布规律 五、正态分布的应用(医学参考值范围五、正态分布的应用(医学参考值范围)47 Fraction5.88*3.75.70.19230848495051关于关于与与 当恒定时,愈大,曲线沿横轴愈向右移。当恒定时,愈大,曲线沿横轴愈向右移。反之则左移;反之则左移;当恒定时,愈大,曲线愈“矮胖”。反之愈当恒定时,愈大,曲线愈“矮胖”。反之愈“瘦高”。“瘦高”。一般用一般用 N(、(、)表示均数为)表示均数为,标准差为,标准差为的正态分布。的正态分布。5253关于关于标准正态分布标准正态分布 若将坐标轴的原点移到的位置,也即使若将坐标轴的原点移到的位置,也即使=0=0;横轴尺度以为单位,也就是使横轴尺度以为单位,也就是使=1=1。则正态分布。则正态分布就转换成为就转换成为标准正态分布标准正态分布。表示为:。表示为:uN(0,1)。式式中中,u=(x-)/5455(三)正态曲线下面积的分布规律(三)正态曲线下面积的分布规律 3.曲线对称于曲线对称于 u=0,即:,即:(-)=()。比如区间(比如区间(-,-2.58)与区间()与区间(2.58,)面)面积相等。积相等。4.曲线下横轴上的面积为曲线下横轴上的面积为 100%或或 1。例:查区间(例:查区间(2.58,)的面积。即为)的面积。即为(-,-2.58)56记记住几个常用的面积住几个常用的面积 变量值范围变量值范围 正态曲线下面积正态曲线下面积(频率或概率)(频率或概率)68.27%68.27%1.961.96 95.00%95.00%2.582.58 99.00%99.00%5758(二)、医学参考值范围的估计(二)、医学参考值范围的估计 v 正态分布法正态分布法v 百分位数法百分位数法59正态分布法正态分布法 其计算公式为:其计算公式为:suX。公式中的公式中的 u u 值可值可由统计表中查得。其中最常用的为:由统计表中查得。其中最常用的为:95%95%正常值范围:正常值范围:s96.1X :双侧双侧 99%99%正常值范围:正常值范围:sX58.2:60正态分布法95%95%正常值范围:正常值范围:sX645.1 (下限)(下限)单侧单侧 或或 sX645.1 (上限上限):99%99%正常值范围:正常值范围:sX326.2 (下限)(下限)或或 sX326.2 (上限):(上限):61单侧界值如何确定应取上限还是下限?可根据正单侧界值如何确定应取上限还是下限?可根据正常与异常的分界线而定。常与异常的分界线而定。如:假设用“如:假设用“”表示”表示“正常”;“正常”;“”表示异常”表示异常 :低低 高高 低低 高高 应制订上限应制订上限 应制订下限应制订下限 626364 例例10-11 10-11 某地调查正常成年女性某地调查正常成年女性200200人的血人的血清总蛋白含量(近似正态分布),得均数为清总蛋白含量(近似正态分布),得均数为73.5g/L73.5g/L,标准差为,标准差为3.9g/L3.9g/L,试估计该地正常,试估计该地正常成年女子血清总蛋白含量的成年女子血清总蛋白含量的9595参考值范围。参考值范围。因本资料近似服从正态分布,故采用正态分布因本资料近似服从正态分布,故采用正态分布法;又因该指标过高或过低均属异常,故应取法;又因该指标过高或过低均属异常,故应取双侧。故有:双侧。故有:即即 65.965.981.1(g/L)81.1(g/L)结论:该地健康成年女性血清总蛋白含量的结论:该地健康成年女性血清总蛋白含量的95%95%参考值范围为参考值范围为65.965.981.1(g/L)81.1(g/L)。93961573961.s.X 65 附:常用附:常用 u u 值表值表 参考值范围(参考值范围(%)单侧单侧 双侧双侧 8080 0.8420.842 1.2821.282 9090 1.2821.282 1.6451.645 9595 1.6451.645 1.9601.960 9999 2.3262.326 2.5762.576 66表表 7-5 200 名健康成人血铅值频数分布及名健康成人血铅值频数分布及 P95计算表计算表 预防医学(三版)预防医学(三版)116 页页 组段组段 频数频数 f 累计频数累计频数f 累计频率累计频率(%)3 36 36 18.0 8 36 75 37.5 12 47 122 61.0 18 20 152 76.0 23 18 170 85.0 28 16 186 93.0 33 3 189 94.5 38 7 196 98.0 43 1 197 98.5 48 1 198 99.0 53 1 199 99.5 5862 1 200 100.0 67百分位数法:百分位数法:由于许多医学资料并不服从正态分布,因由于许多医学资料并不服从正态分布,因而不能用上述公式计算之。因改用百分而不能用上述公式计算之。因改用百分位数法计算。要求样本含量至少大于位数法计算。要求样本含量至少大于100例。例。68 计算公式:计算公式:)%(LxxfxnfiLP 比如,计算单侧比如,计算单侧 95%参考值范围:或取上限参考值范围:或取上限 P95,或取下限或取下限 P5。计算双侧计算双侧 95%参考值时,应同时计算参考值时,应同时计算 P2.5 与与 P97.5。69计算实例:据表计算实例:据表 7-5 中,中,200 名正常人血铅值名正常人血铅值(ug/100g),估计该地正常成人血铅值的),估计该地正常成人血铅值的 95%参考值范参考值范围。围。因正常人血铅为偏态分布,故应用百分位数法。据医因正常人血铅为偏态分布,故应用百分位数法。据医学知识可知,血铅过高方属异常,故应取单侧上限学知识可知,血铅过高方属异常,故应取单侧上限:)g100/g(7.38)189%95200(7538 )f%95n(fiLPLx95 正 常 人 血 铅 值 的正 常 人 血 铅 值 的95%参 考 值 范 围 为 小 于参 考 值 范 围 为 小 于38.7(g/100g)。70CASIO fx3600Pv 计算器使用介绍 PCL SHIFT DEC HEX P1 P2 MODE d/c x2 10 x e x x1/y a b/c ENG log ln x y 3 sin-1 cos-1 tan-1 +/+/-,hyp sin cos tan 1/x X!X Y X K in M-()kin kout MR M+xD,YD x y 71CASIO fx3600Pv 计算器使用介绍计算器使用介绍 x0 X M RTN KAC 7 8 9 C AC ON A B r 4 5 6 2 yy y ny yx y1n R P P R 1 2 3 +-2 xx x xn n x1n RND RAN%ENT HLT 0 EXP =RUN DATA DEL 72复习思考题复习思考题 1 如何编制数值变量资料的频数表?如何编制数值变量资料的频数表?2 常用的描述数值变量资料集中水平的指标常用的描述数值变量资料集中水平的指标 有哪有哪些些?如何如何 计算?计算?3 怎样根据资料的性质正确选用平均数?选怎样根据资料的性质正确选用平均数?选 用时有哪些用时有哪些注注意事项意事项?4 描述数值变量资料离散趋势的指标有哪描述数值变量资料离散趋势的指标有哪些?其中较常用且十分重要的指标有哪些?其中较常用且十分重要的指标有哪些?如何计算?些?如何计算?5 标准差有哪些作用?变异系数的适用条件标准差有哪些作用?变异系数的适用条件及应用注意是什么?及应用注意是什么?7374计算器使用练习 5名7岁男童体重(kg)为:17.3,18.0,19.4,20.6,21.6。求平均体重和标准差。75计算器使用练习 2、某市101例30-49岁健康男子血清总胆固醇测定值整理频数表如下,求均数、标准差、标准误。组组段段 1 10 00 0 1 12 20 0 1 14 40 0 1 16 60 0 1 18 80 0 2 20 00 0 2 22 20 0 2 24 40 0 2 26 60 0-2 28 80 0 合合计计 组组中中值值 X X 1 11 10 0 1 13 30 0 1 15 50 0 1 17 70 0 1 19 90 0 2 21 10 0 2 23 30 0 2 25 50 0 2 27 70 0 频频数数 f f 3 3 9 9 1 12 2 2 27 7 2 23 3 1 12 2 8 8 6 6 1 1 1 10 01 1 76计算器使用练习 3 40名麻疹易感儿接种麻疹疫苗后一个月血凝抑制抗体滴度如下,求平均滴度 抗抗体体滴滴度度之之倒倒数数 4 4 8 8 1 16 6 3 32 2 6 64 4 1 12 28 8 2 25 56 6 5 51 12 2 合合计计 人人数数 f f 1 1 5 5 6 6 2 2 7 7 1 10 0 4 4 5 5 4 40 0 77分组分组原则原则:各组段上下衔接,且界限分明,互不交叉各组段上下衔接,且界限分明,互不交叉(举例);第一组段须包括最小值、最后(举例);第一组段须包括最小值、最后一组段必须包括最大值。一组段必须包括最大值。组段的起点称下限,终点称上限。每组从组段的起点称下限,终点称上限。每组从下限开始,至上限结束(不包括上限。但下限开始,至上限结束(不包括上限。但最后一组例外)。最后一组例外)。一般组段及最后一组段的书写方一般组段及最后一组段的书写方式。式。
展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:演示文稿2—平均数与标准差
链接地址:https://www.zhuangpeitu.com/article/168153792.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!