卫生统计学第一章

上传人:沈*** 文档编号:228367443 上传时间:2023-08-21 格式:PPTX 页数:103 大小:728.64KB
收藏 版权申诉 举报 下载
卫生统计学第一章_第1页
第1页 / 共103页
卫生统计学第一章_第2页
第2页 / 共103页
卫生统计学第一章_第3页
第3页 / 共103页
资源描述:

《卫生统计学第一章》由会员分享,可在线阅读,更多相关《卫生统计学第一章(103页珍藏版)》请在装配图网上搜索。

1、第一章 定量资料的统计描述统计学(Statistics)是研究数据的搜集、整理、分析与推断的科学。卫生统计学(Medical statistics)是运用概率论与数理统计的原理和方法,研究卫生事业管理与卫生经济中出现的不确定现象的一门应用学科。第1页/共103页统计步骤 统计设计(experiment designexperiment design)搜集资料(collection datacollection data)整理资料 (sorting data)(sorting data)分析资料 (analysis data)(analysis data)第2页/共103页变异同质(homoge

2、neity):除实验因素外,影响被研究指标的非实验因素相同被称为同质。(对研究指标影响较大的,可以控制的主要因素是相同的。)变异(variance):同质基础上的个体差异称为变异。第一节 基本概念第3页/共103页n例某地某年用随机抽样方法检查了140名健康成年男子的红细胞数(1012/L):4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834

3、.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93观察指标的同质部分:“某地某年健康成年男子”观察指标的变异部分:各个体间红细胞数间的差异第4页/共103页一、总体(population):根据研究目的确定的同质的个体所构成的全体。二、样本(sample):从总体中随机抽取的部分个体。样本中所包含的个体数目称为样本容量。第5页/共103页参数和统计量参数(parameter):

4、统计学中把描述总体的特征数称为参数,如、。统计量(statistic):描述样本的特征数称为统计量,如 、s、p。总体样本抽取部分观察单位 统计量 参 数 第6页/共103页三、变量(variable)观察对象的特征或指标。变量值(valueofvariable)变量的测量和观察结果。第7页/共103页住院号住院号年年龄龄身高身高体重体重住院住院天数天数职业职业文化文化程度程度分娩分娩方式方式妊娠妊娠结局结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足

5、月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产20194642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variables变量值value of variable第8页/共103页变量类型 变量值表现 例定量变量 定量(数值的大小)住院天数分

6、类变量 定性(不相容的类别)无序分类 二项 对立的两项 疗效:治愈、未愈 多项 不相容的多类 血型:A、B、O、AB 有序分类 类别间有程度差别 疗效:治愈、显效、(等级)好转、无效 变量的类型及变量值的表变量的类型及变量值的表现现第9页/共103页计量资料(measurementdata):对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位。计数资料(enumerationdata):先将观察对象的观察指标按性质或类别进行分组,然后计数各组的数目所得的资料。统计资料的类型等级资料(ranked data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察

7、单位数。第10页/共103页住院号住院号年年龄龄身高身高体重体重住院住院天数天数职业职业文化文化程度程度分娩分娩方式方式妊娠妊娠结局结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产2019

8、4642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月计量资料计数资料第11页/共103页三类资料间关系 例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数 中位数众数。3)在负偏态分布中平均数中位数众数。4)根据资料的分布选用适当的平均数。对称分布资料,尤其是正态分布资料正态分布资料,宜用均数,也可用中位数,而偏态分布偏态分布资料资料则中位数的代表性较好,对数正态分布及等比级数资料对数正态分布及等比级数资料宜用几何均数。第32页/共103页盘编号盘编号 甲甲乙乙丙丙1 14404804902 2

9、4604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙二、离散性度量第33页/共103页1.极差(range,R)也称为全距,用R表示,一组资料中最大值与最小值之差。缺点:1)除了最大、最小值外,不能反映组内其他数据的变异度。2)样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。3)即使样本含量相同,极差也不够稳定。第34页/共103页极差极差

10、(Range(Range)(全距全距)1204020符号:R意义:反映全部变量值的变动范围。优点:简便,如说明传染病、食物中毒的最长、最短潜伏期等。缺点:1.只利用了两个 极端值 2.n大,R也会大 3.不稳定适用范围:任何计量资料;是参考变异指标第35页/共103页2.2.四分位数间距四分位数间距百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px。四分位间距:Q QU-QL P75P25 P100(max)P75P50(中位数)P25P0(min)PxQ适用于各种类型的连续型各种类型的连续型变量变量,特别是偏态分布的资料。第36页/共103页3.方差(variance)A

11、组 26 28 30 32 34 C组 26 29 30 31 34(X-)df=n-1,称为自由度(能自由取值的变量的个数)。第37页/共103页4.标准差(standard deviation,S)第38页/共103页标准差的计算标准差的计算盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 21 14404804901936002304002401002 24604904952116002401002450253 35005005002500002500002500004 45405105052916002601002550255 556052051031360027040026010

12、0合计合计25002500 25002500 25002500 1260400 1251000 1250250标准差标准差50.9915.817.91第39页/共103页5.变异系数(coefficient of variation,CV)公式为:常用于:1)比较度量单位不同的多组资料的变异度。例1-18 1985年通过10省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm,试比较二者变异度。体重 CV=0.98/8.42100%=11.64%身高 CV=3.0/72.4100%=4.14%第41页/共103页2)比较均数相差

13、悬殊的几组资料的变异度。3-3.5岁 100 96.1 3.1 3.2330-35岁 100 170.2 4.0 2.35 年龄组 人数 均数 标准差 变异系数(%)某地不同年龄段男子身高的变异度第42页/共103页第三节常用统计图表 统计表(statistical table)和统计图(statistical chart)是统计描述的重要工具。资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计图表可以对于数据进行概括、对比或做直观的表达。统计表和统计图不仅便于阅读,而且便于分析比较。第43页/共103页 频数(frequency):对

14、一个随机变量做重复观察,其中某变量值出现的次数。频数分布表(frequency distribution table):将各变量值及其相应的频数列成表格的形式。第44页/共103页一、连续型定量变量的频数分布例2-2 抽样调查某地120名18岁35岁健康男性居民血清铁含量(mol/L)见P12,试编制频数分布表。第45页/共103页(一)频数分布表的编制步骤:(1)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距:815个组段,组距i=全距/组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。下限:每个组段的起点(最小值)。上限:每个组段的终点(

15、近似最大值)。注:最后一个组段应同时写出上限和下限来。两端的组段应分别包含最小值或最大值;尽量取较整齐的数值作为组段的端点,便于对数据进行表述;组距以相等为宜。第46页/共103页(4)归组划记:频数、频率、累积频数、累积频率。注:各组段的频数之和应等于总的观察例数。频率:各组频数除以总例数n所得的比值。累计频数:本组段的频数与以前各组段的频数相加;累计频率:每组段的累计频数除以总例数。第47页/共103页第48页/共103页(二)连续型变量的频数分布图 直方图 连续型变量的频数分布图,以直方的面积大小表示频率的多少。以横轴表示被观察变量,纵轴表示频率密度,以各矩形(宽度为组距)的面积代表各组

16、段的频率。第49页/共103页 图中横轴为血清铁含量,纵轴为频率密度,直条面积等于相应组段的频率。第50页/共103页 频数表的用途 1.文献中常将频数表作为陈述资料的形式。揭示频数分布的分布特征和分布类型。2.便于进一步计算统计指标和进行统计分析处理。3.便于发现某些特大或特小的可疑值。第51页/共103页二、统计表1概念:常将统计分析的事物及其指标用表格列出,以反映事物的内在规律性和关联性。2作用:1)避免繁杂的文字叙述2)便于计算3)便于事物间的比较分析第52页/共103页统计表的结构 从外形上看,统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和备注5部分构成。其基

17、本格式如表1:第53页/共103页1)标题:概括说明表的中心内容,要求用词简练、确切。必要时注明资料的时间、地点,写在表的上端中央。注意:防止标题过于简略或过于繁杂2)标目:要求文字简明,有单位的标目要注明单位。横标目位于表的左侧,说明各横行数字的含义。纵标目位于表的右侧,向下说明各纵行数字的含义。注意:防止标目过多,层次不清。第54页/共103页 从内容上看,每张表都有主语和谓语。主语指被研究的事物,如表2-1中的药物分组,一般置于表的左侧;谓语指说明主语的各项统计指标,如表2-1中的“治愈”和“未愈”、“合计”,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表2-1可读成用替硝

18、唑治疗组治愈25例,未愈4例,合计29例。611843合计321418甲硝唑29425替硝唑合计未愈治愈分组表 不同药物治疗急性冠周炎效果比较第55页/共103页3)线条:只需要顶线、底线及纵标目下面与合计上面的横线。注意:线条不宜过多,表的左上角不宜有斜线,表内不能有纵线。4)数字:表内数字一律用阿拉伯数字表示,同一个指标的数字精确度应当一致,表内不宜有空格,不祥数据用“”表示,不存在数据用“”表示,数字为0,则填写0。5)备注:表格一般不列备注或其他文字说明,如有特殊情况需要说明时可用“*”标出,将文字说明写在表格的下面。第56页/共103页统计表的种类 根据说明事物的主要标志(主语)的复

19、杂程度,统计表可以分成简单表和复合表。l)简单表:只有一种主要标志,即主语按一个标志分组。2)复合表:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将部分主语放在表的上方与谓语配合起来。第57页/共103页611843合计321418甲硝唑29425替硝唑合计未愈治愈分组表 不同药物治疗急性冠周炎效果比较第58页/共103页20010025751002575合计100501733501535B10050842501040A合计无效有效合计无效有效合计乙医院甲医院药物表 A、B两种药物在甲、乙两医院的疗效第59页/共103页编制统计表的基本要求 1)重点突出,简单明了。即一张表只包括

20、一个中心内容,表达一个主题。2)主谓分明,层次清楚。即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。简单表只有一个分组标志,一般作为横标目,而纵标目就是统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。3)数据准确、可靠。第60页/共103页统计表的审查与修改 统计表制作是否良好,可以从以下几方面检查:1)标题是否正确。2)主谓语的排列是否合适,标目是否组合重复。3)表线是否过多过密。第61页/共103页某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如下表所示,请按照编制统计表的基本要求,检查此表编制

21、的是否合适,如不合适,请指出并修改成正确表。第62页/共103页 上表的缺点是:1)标题不确切,并且未注明时间与地点。2)发病季节、年龄、职业三项指标放在一起,内容繁杂,不能突出重点。3)标目设计不合理。人数、%多次重复,不便于比较分析。4)表内文字和线条过多。第63页/共103页100.0111合计5.469月上旬25.2288月下旬63.1708月中旬6.378月上旬%人数季节 表1 某地1974年钩端螺旋体病患者发病季节分布(修改表)第64页/共103页100.0111合计3.6445及以上85.6951510.81215以下%人数年龄(岁)表2 某地1974年钩端螺旋体病患者发病年龄分

22、布(修改表)第65页/共103页100.0111合计0.91其他2.73待业青年0.91学生95.5106农民%人数职业 表3 某地1974年钩端螺旋体病患者发病职业分布(修改表)第66页/共103页三、统计图1.概念:利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料和指标.2.作用:它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。常用的统计图有:条图、百分条图、圆图、普通线图、半对数线图、直方图、箱图、茎叶图、散点图、人口金字塔。第

23、69页/共103页3.制图的基本要求 统计图通常由标题、标目、刻度、图域和图例5部分组成。1)标题:简明扼要地说明资料的内容、时间和地点.一般写在图的下方中央。2)图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条(实线、虚线、点线)或颜色表示。图域的高:宽比例习惯上为5:7。第70页/共103页 3)标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。4)图例:在对比关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横轴与标题之间。5)刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系

24、的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距表明。第71页/共103页4.常用统计图的绘制方法及要求 绘制统计图时要根据资料的性质和分析的目的选择适当的图形。第72页/共103页1)条图 条图(bar graph):适用于性质相似而不连续的资料。用等宽的直条的长短来表示各独立指标数值大小和它们之间的对比关系。指标既可以是绝对数,也可以是相对数。为便于比较,被比较的指标一般按大小顺序排列。第73页/共103页A)单式直条图只有一个统计指标,一个分组因素。如下图2-6。第74页/共103页B)复式条图具有两个统计指标,两个及以上分组因素。如下图2-7。第75页/共1

25、03页绘制直条图时应注意以下几点:1坐标:一般以横轴为基线,表示各个调查项目。纵轴尺度必须从0开始,表示各个项目相应的数据,而且要等距,否则会改变各对比组间的比例关系。2宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽。3排列:直条一般可按高低顺序排列,以便于比较。但如果各指标间需要有一定的顺序时,也可按规定的顺序排列。注意:复式条图中组内各直条排列次序要前后一致,并加以图例。第76页/共103页2).圆图(circle graph)圆图:适用于构成比资料。用圆形的面积表示事物全部,而用其中各扇形面积表示各构成部分。第77页/共103页表两种脱落牙再植效果合计 40

26、100.00 50 100.00成功 12 30.00 20 40.00良好 12 30.00 7 14.00较好 12 30.00 13 26.00失败 4 10.00 10 20.00效果 嵌入性脱位牙 构成比(%)脱落牙 构成比(%)第78页/共103页绘制圆图时应注意以下几点:1.先绘圆,将构成比乘以3.60,即得各构成部分所占的圆心角的度数。2.以相当于时钟的9点或12点的位置为起点依次排列各个扇形。3.扇形内要注明简要文字和百分比。4.两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成部分排列次序要一致。第79页/共103页3).百分条图

27、(percent bar graph)百分条图:适用于构成比资料。用矩形长条的面积表示事物全部,而用其中各段表示各构成部分。第80页/共103页表两种脱落牙再植效果合计 40 100.00 50 100.00成功 12 30.00 20 40.00良好 12 30.00 7 14.00较好 12 30.00 13 26.00失败 4 10.00 10 20.00效果 嵌入性脱位牙 构成比(%)脱落牙 构成比(%)第81页/共103页绘制百分条图时应注意以下几点:1将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。2将直条全长按构成比分为几段,

28、在图上标出各部分构成比的数值,并用图例说明各部分的名称。3两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,一般为直条宽度的一半。第82页/共103页5).线图(普通线图 line graph)线图:适用于连续性变量的资料。用线段的升降来表示统计指标的变化趋势,如某事物在时间上的发展变化,或某现象随另一现象变迁的情况。第83页/共103页0.010.1419900.020.2319850.050.8219800.221.451975百日咳痢疾年度表2-9某地19751990年痢疾与百日咳死亡率第84页/共103页绘

29、制线图时应注意以下几点:1.横轴代表分组标志,纵轴代表统计指标。横轴和纵轴都是算术尺度。2.相邻两点用直线连接,也就是说图线应按实际数字绘制成折线,而不能任意修改为光滑曲线。3.同一图内不应绘制太多的曲线,一般不宜超过4-5条。若有几根线,应用不同颜色或不同图线表示,并附图例说明。4.在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。第85页/共103页半对数线图(semi-logarithmiclineargraph)半对数线图:是一种特殊的线图,其坐标纵轴是对数尺度,用来比较两种或多种事物的相对变化速度。半对数线图中线段的升降是用来表示某事物发展速度。第86页/共103页0.

30、010.1419900.020.2319850.050.8219800.221.451975百日咳痢疾年度表2-9某地19751990年痢疾与百日咳死亡率第87页/共103页注意:在普通线图中,结核病死亡率线条的坡度比白喉死亡率线条下降的陡峭,只能说明两种疾病的死亡率逐年变化幅度不同,不能错认为结核病死亡率的下降速度比白喉死亡率的下降速度快。在半对数线图中就不会出现这种错觉。在比较事物间的变化速度时,应选择半对数线图。第88页/共103页绘制半对数线图时应注意以下几点:1.在半对数坐标纸上作图:如无半对数坐标纸,也可将数据转换成对数值,然后在普通坐标纸上作图。2.纵轴和横轴:横轴用算数尺度表示

31、各分组标志,纵轴用对数尺度表示指标数值的大小。第89页/共103页6).直方图(histogram)直方图:适用于连续变量的频数分布资料。常用横轴表示变量(即被观察对象),纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。第90页/共103页第91页/共103页第92页/共103页绘制直方图应注意以下几点:1纵轴的刻度必须从“0”开始,而横轴的刻度可按实际范围制定。2作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。如果各组段的组距不同,必须换算成等距后才能作图。第93页/共103页7).箱图(boxgraph)箱图:用于比较两组或多组数

32、据的直观比较分析,描述其分布特征。一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。第94页/共103页第95页/共103页箱式图的箱子两端分别是上四分位数(P75)和下四分位数(P25),中间横线是中位数(P50)两端连线分别是除异常值外的最小值和最大值。另外标记可能的异常值。显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。第96页/共103页例 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成下图。图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。第97页/共103页8).茎叶图(stemandleafgraph)第98

33、页/共103页有一个容量为50的样本,其数据的茎叶图表示如下:12334566678888999000011222223333445556666777888901123第99页/共103页 散点图:以直角坐标系中各点的密集程度和趋势来表示两现象间的关系。常在对资料进行相关分析之前使用。适用资料:双变量资料。9).散点图(scattergraph)第100页/共103页12名女大学生身高与体重散点图第101页/共103页Analyze-descriptive statistics-descriptives(或frequences)做直方图Graphshistogram第102页/共103页谢谢您的观看!第103页/共103页

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!