卫生统计学知识点(笔记)

上传人:s****a 文档编号:213019529 上传时间:2023-05-24 格式:DOCX 页数:39 大小:153.34KB
收藏 版权申诉 举报 下载
卫生统计学知识点(笔记)_第1页
第1页 / 共39页
卫生统计学知识点(笔记)_第2页
第2页 / 共39页
卫生统计学知识点(笔记)_第3页
第3页 / 共39页
资源描述:

《卫生统计学知识点(笔记)》由会员分享,可在线阅读,更多相关《卫生统计学知识点(笔记)(39页珍藏版)》请在装配图网上搜索。

1、第一章 绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收 集、分析、解释和表达数据,目的是求得可靠的结果。2. 总体(population)用来表示大同小异的对象全体,例如一个国家的所有 成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下 结论,这个总体便称为目标总体(target population);资料常来源于目标总 体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研 究总体所下的结论未必适用于目标总体。3. 样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样 本的过程称为抽

2、样(sampling)。抽样研究的目的是用样本数据推断总体的特征。 需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地 达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。4. 同质(homogeneity)是指同一总体中个体的主要性质相同。5. 变异(variation)是指同质的个体之间存在的差异。6. 变量的类型二分类变量分类变量或名义变量-定性变量-L多分类变量 L 有序变量或等级变量L定量变量离散型变量L连续型变量表1-1 变量类型及特点变量类型特点分类变量1. 取值为某种属性2. 无度量衡差异没有程度的差异有序变量各组之间有性质上的差异或程 度

3、上的不同离散型变量1. 有度量衡单位2. 通过测量而来3. 表现为一个具体的只能取整数值连续型变量可以取实数轴上的任何数值变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量 有序 分类 二值7. 参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是 一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数U,总体标准差0。8统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察 资料计算出来的,如样本均数X,样本标准差S。统计学的任务就是依据样本统计量来推断总体参数。9. 概率与频率的区别:概率是

4、参数,频率是统计量;频率总是围绕概率上下 波动。当某事件发生的概率W0.05时,即PW0.05,统计学习惯上称该事件为小 概率事件。10. 误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为 系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的; 而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使 其减小。11. 因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多 数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。第二章 定量变量的统计描述第一节 频率分布表与频率分布图1. 频率分布表:是指对各变量值出现的

5、频率列表,简称频率表,频率分布表的图 形表示即为频率分布图。2. 编制频率表的注意事项:(1)分组不宜过粗或过细,组段数一般取 10 左右,且常采用等距分组;(2)各组段要连续但不能重叠,除最后一个组段外,其余组段应包含下限值, 不包含上限值。(3)第一组段应包含最小值,最后一个组段应包含最大值。3编制频率分布表(图)流程:(1)求极差(全距)(2)划分组段:确定组段数、组距(3)根据组距分组(4)制作频数表和频数图4. 频数分布表(图)的用途:(1)描述变量的分布类型对称分布分布I-正偏峰分布偏峰分布负偏峰分布2)揭示变量的分布特征集中趋势(平均水平): 分布特征-离散趋势(变异程度):算术

6、均数、几何均数、中位数、众数极差、四分位数间距、方差、标准差、变 异系数3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析第二节 描述平均水平的统计指标1. 均数的特性: 各观察值与均数之差(离均差)的总和等于0乞(x - X)= 0 各观察值的离均差平方和最小工(x-x)常用的平均数的比较 Y(x-a)2(a丰x) (x为表中数,a为表中任意Hx的数)类别适用条件计算方法算术均数资料服从对称分布,特别是正态分布1. 直接法2. 频率表法(计算公式详见课本)几何均数1.等比级数资料2.对数正态分布中位数各种分布,特别是偏锋分布,分布不明、 以及分布一段或两端无确定数值的资料PS

7、:正态分布 :均数=中位数 正偏峰分布:均数中位数 负偏峰分布:均数中位数3. 百分位数( P )x P 二 L + 丄(n x % - F )xflxL :欲求的百分位数所在组段的下限i :该组段的组距f :该组段内的频数xn :总频数Fl:所在组段的累计频数L百分位数 P 就是中位数504. 众数(mode):总体/样本中出现次数最多的数值第四节 描述变异程度的统计指标1描述变异程度的统计指标比较种类适用条件优点缺点极差(R)计算简便1. 样本量越大, 极差可能越大;2. 不够稳定四分位数间距 (Q)各种分布,尤其是偏峰分布较稳定,受两端极大或 极小数据的影响小未考虑数据中每 个观察值的离

8、散 程度方差考虑到数据中每个观 察值的离散程度1. 数学处理上比 较困难2. 量纲是原变量 量纲的平方标准差服从正态分布或近1.量纲与原变量一致似正态分布的变量2.考虑到数据中每个 观察值的离散程度变异系数(CV)不同变量间变异程 度的比较,尤其是 量纲不同的变量间 的比较(注:具体计算公式详见课本) 小结:对于服从正态分布或近似正态分布的变量,常把算术均数和标准差结合起 来(XS),从平均水平和变异程度两方面描述变量的分布特征;对于服从偏 峰分布的变量,常把中位数和四分位数间距结合起来描述变量的平均水平和变异 程度。第五节 统计表和统计图1. 统计表的组成部分(1)表号及标题:位于统计表上方

9、中央。(2)标目:分为横标目和纵标目。(3)线条:常用“三线表”,包括顶线、底线和纵标目分隔线;左右两侧不应 有边线,左上角不宜有斜线,表内不应有竖线。(4)数字:服从正态分布用(均数标准差)描述;不服从正态分布用中位数 (下四分位数上四分位数)。表内不留空格,数字暂缺或未记录用“.”表示, 无数字用“-”表示。(5)备注:非基本要素,在统计表下方。2. 绘制统计图的基本要求(1)图号和标题:位于图的下方中央。(2)纵横坐标轴:标目尺度,纵轴尺度自下而上,横轴尺度自左而右,数量一 律由小到大,并等距表明。(3)直方图、累计频率分布图和直条图纵坐标要从 0开始。(4)纵横坐标长度的比例一般为 7

10、:10。3. 描述定量变量的常用统计图比较种类适用情况注意点直方图连续型定量变量纵坐标为频率密度,总面积为100%累计频率分布图连续型变量的累积频率分 布纵坐标为各组段的累积频率箱式图定量变量使用5个指标(最小值、P25、P。、P、最大值),具有能够显示数据75中的离群值或极端值的优点。直条图离散型定量变量和定性变 量用等宽直条的高度表示相互独立 的各项指标数量的大小第三章 定性变量的统计描述第二节 常用相对数指标1. 常用的相对数指标指标类型定义特征频率型某事件发生的频率,或事物内部某个组 成成分所占的比重或分布1. 分子疋分母的 部分;2. 无量纲,在0-1之间取 值3. 合计值为1强度型

11、单位时间内某事件发生的频率1. 本质为频率强度;2. 限定“单位时间”相对比型两个有关联的指标A与B之比1. A与B可以性质相同, 也可性质不同;2. A、B两指标可以是绝 对数、相对数或平均数注:具体计算公式详见课本)2. 应用相对数时的注意事项(1)理解相对数的含义不可望文生义;需牢牢掌握三者的概念(2)频率型指标的解释要紧扣总体与属性;(3)计算相对数时分母应有足够的数量;样本例数较少会使相对数波动较大(4)正确计算合计频率;(5)注意资料的可比性;在比较相对数时,除了要对比的因素(如不同的药物) 其余的影响因素应尽可能相同或相近(6)样本相对数的统计推断。应进行参数估计与假设检验第三节

12、 医学人口统计常用指标1. 描述人口特征的常用指标(1)人口总数:一般指一个国家或地区在某一特定时间的人口数,按惯例,一 般采用一年的中点,即7月1日零时为标准时点进行统计。(2)平均人口数:通常是指相邻两年年末(12 月 31 日)人口数的平均值,当 人口数在一年中是均匀变动时,也可用年中(7 月 1 日零时)人口数代表全年的 平均人口数,平均人口数常用作计算出生率、死亡率、发病率等指标的分母。)人口学特征指标指标分子分母基数指标类型老年(人口)系数65岁人口数人口总数100%频率型少儿(人口)系数14岁人口数人口总数100%频率型总负担系数14岁人口数+ 65 岁人口数15-64岁人口数1

13、00%相对比型少儿负担系数14岁人口数15-64岁人口数100%相对比型老年负担系数65岁人口数15-64岁人口数100%相对比型老少比65岁人口数1 ,未来人口 将增多;NRR1 ,未来人口 将减少4. 测量死亡水平的指标指标定义分子 分母用途粗死亡率某地 某年 平均 每 千人 口中 的死 亡 数同年内死亡人数年龄别死亡率某年 某年 龄别 平 均每千人口中的 死亡数同年某年龄组死亡人数婴儿死亡 某年活产儿中未 同年1 周年平均人口数 X1 反映当地居民年总的死亡水平同年某年龄组平均人口数X1年同年活产儿总数 反映社会卫生率满一周岁婴儿的死亡频率岁死亡人数同年围生期围生儿死死胎数+死亡率产数+

14、50)总体均数卩的双侧(1-a )置信区间记为:G-z S_,X + z S_)a /2 Xa/2 X(二)总体均概率的置信区间1. 查表法:小样本资料(如n0.05(不是小概率事件,有可能得到手头的结果),故根据现有的样本无法拒绝事先的假设(没理由)。4. 假设检验的基本步骤(1)建立假设,确定检验水准。零假设/原假设/无效假设:表示为H, H: u=u。该假设将差异的原因归结为抽 0 0 0样误差。对立假设/备择假设:表示为H,该假设将差异的原因归结为非抽样误差。H=的内容反映了检验的单双侧:1 双侧检验:备则假设为两总体均数不等包含口 口。1212 单侧检验:凭借专业知识有充分把握可以排

15、除某一侧,备择假设为口或12 者口 口。12PS:什么是显著性水平? 又称a水准,是预先规定的概率值,它确定了小概率事件的标准。a为I型错 误的概率大小。实际工作中常取a= 0.05。但a的取值并非一成不变,可根据 不同研究目的给予不同设置。 无效假设为真时,拒绝无效假设的概率,被称为抽样分布的拒绝域。 表示为a(alpha),常用的a值有0.01, 0.05。(2)计算检验统计量 根据分析目的、资料类型、设计类型、样本大小、方法的适用条件等选择相应的 检验方法并计算检验统计量。所有检验统计量都是在假设 H 成立的条件下计算0出来的,它是用于决定是否拒绝H的统计量,其统计分布在统计推断中至关重

16、0要。(3)确定P值,作出统计结论 根据给定的检验水准,查表得出相应的临界值 将检验统计量的值(t、Z值)与检验水准相对应的临界值进行比较,即可得 到概率P。 得出拒绝或不拒绝无效假设(H )的结论。0注意:P值是在H成立前提下,抽得比现有样本统计量更极端的统计量值的概率。0P值越小只能说明:作出拒绝H,接受H的统计学证据越充分。01第二节 t检验1. 单样本资料的t检验(计算)(】)使用范围:用于样本均数与已知总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。(2) 分析目的:推断样本所代表的未知总体均数u与已知总体均数u0有无差别。(3) 应用条件:。未知且n较小,样本取

17、自正态总体;(4) 公式:t =0S / W2. 配对设计资料的t检验(计算)(1) 目的:配对设计是研究者为了控制可能存在的非处理因素,增加两组的可 比性而采用的一种实验设计方法,当总样本量一定时,采用配对设计往往会获得 较高的检验效能。(2) 厶配对设计实施的主要形式: 异体配对。将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性 别等),再随机分配每对中的两个受试对象到不同的处理组; 自身配对。同一受试对象分别接受两种不同处理,其目的是推断两种处理的效 果有无差别。注意:在实际应用中,同一受试对象接收某种处理之前和之后的数据,也可试为 自身配对。但需特别注意:如果观察指标随时间变

18、化而变化时,对结果的解释要 慎重。优点:配对设计减少了个体差异。特点:资料成对,每对数据不可拆分。(3) 应用条件:对于配对设计定量资料的统计分析,若差值服从正态分布,可 采用配对t检验。(4) 公式:t =. ,v = n 1S /Jnd3. 两独立样本资料的t检验(1)成组设计两总体均数比较有两种类型: 将研究对象随机分为两组分别接受不同的处理,一般把这样获得的两组资料视 为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等; 另一种从两个研究总体中随机抽样,比较某一指标是否相等,目的是推断两个总体均数是否相等。(2)0应用条件:两样本分别来自正态分布总体(当每组的样本例数均大于5

19、0时,可以不必进行正态性检验,因为近似正态)两样本来自的总体方差齐。3)公式:X - X12其中S是利用两样本联合估计的方差cc(n -lk2 +(n - 1)S2S = 1122cn +n -212PS:方差不齐时要用t检验,公式见P1094. 两独立样本资料的方差齐性检验(1)有两种方法可以判断条件方差齐性是否成立: 直观分析:当两样本的方差相差超过3倍时,认为方差齐性不成立; 进行方差齐性检验。S2(2)公式: F = ,v = n 1, v = n 1S2 1 1 2 22(3)若两总体方差不等: 近似t检验:t检验。 采用数据变换。 非参数检验。5. 大样本资料的Z检验1. 单样本资

20、料的Z检验:样本均数与总体均数比较时(样本来自正态总体), 如果样本量较大(例如,大于100)时,可采用z检验;但只是近似方法。优点: 简单,Z界值与自由度无关。2. 两独立样本资料的 Z 检验:两样本均数比较时(样本来自正态总体),当每 组样本量均较大(例如,大于100 )时,可采用Z检验;但只是近似方法。优 点:简单,Z界值与自由度无关。X - XX - XZ =12 12S IS 2 S 2X1- X 24 + 匸n n飞12第三节 二项分布于poisson分布资料的Z检验(了解)1. 二项分布资料的Z检验(1) 组样本资料的Z检验 条件:np和n(1-p)均大于5时,可用正态近似法。

21、公式:详见P113。若n不太大时,需作连续性校正,公式见书本。(2) 两组独立样本资料的z检验公式:详见P1132. Poisson分布资料的Z检验应用条件:Poisson分布资料Z检验的适用条件入20。但在实际应用中,入通常未知,故可以通过观察样本计数是否大于20来判断。(1) 单样本资料的Z检验当总体均数入20时,依据Poisson分布近似正态分布的原理,可以对其总体均数进行推断。公式例题见P114。(2) 两独立样本资料的Z检验当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z Z检验对其总体均数进行推断。公式例题见P115。第四节假设检验与区间估计的关系1.

22、 置信区间具有假设检验的主要功能。就同一份资料,若假设检验的结果是P或(/i jS 2(N -1)或总X 乞x)X X 2 -nv 二 N-1 总组间(处理组间)X n仗-X丄iiiv = k 1 iSS/( -1)组间MS / MS组间组内组内(误差)SS - SS或总组间X (n - 1)S 2iiiv = N - k2SS/ (N - k )组内6. 随机区组设计资料变异来源SSDFMSF总变异XX (x - x)或iji jS 2 (N -1)或总v = N -1 总y乞X)乙X 2 -nZX处理组y n & X 丄iiiPS: n = bik 1SS /( 1)处理MS / MS处理

23、误差区组y n仗XiiiPS: n = kjb 1SS/( 1)区组MS / MS区组误差组内(误差)SS - SS处理区组N k b 1 或(k - i)b -1)SS/ (N k b 1)误差第二节 方差分析步骤1. 完全随机设计资料方差分析:(1)建立检验假设:H : 口二口二.二口,即所有总体均数相等;H0:至少有两个总体均数不相等,亦即所有总体均数不全相等。(2)计1 算检验统计量:F = MS组间MS组内V 二 V1 组间=V2 组内 F=1处理因素无效 F1处理因素有效 理论上F21,如果VI,可能为误差,而处理因素肯定无效(3)确定P值,作出推断(查P465附表3-2)2. 随

24、机区组设计资料方差分析(检验效能更高)(1)建立检验假设(分别对处理组和区组作检验假设)步骤同上2)计算检验统计量:v =k-1,v 二Nkb+1 或(k1) * (bT) 处理误差V=b1对于处理组:F=MS /MS处理 误差对于区组:F=MS /MS(3)确定P值,作出推断误差第三节 多个样本均数的两两比较1. 适用条件:先用方差分析f如果有差别继续两两比较,如果无差别不用继续方差分析才是总原则2. 比较方法(1) 事后比较,用于探索性研究。常用SNK法,又称q检验(2) 事先有明确假设,用于证实性研究。常用 Dunnett-t 检验(适用于多个实 验组与一个对照组均数的比较)(3) 校正

25、法,探索性,即Bonferroni法,适用于所有的两两比较。a校正=a/m (m为比较次数),目的是:减少犯第I类错误。补充:方差齐性检验(1) Bartlett 2 检验-资料服从正态分布(2) Levene 检验-任意分布小贴士:方差齐性检验时常通过增大a以减少犯第II类错误。PS:方差分析为单侧检验,方差齐性为双侧检验第八章咒2检验1. 用途:(1) 两个或多个率的比较(2) 构成比即频率分布的比较(3) 计数资料的关联度分析(4) 拟合优度检验PS:定性资料可用:x2、Fisher精确概率法、泊松分布、二项分布定量资料:t检验 第一节 独立样本四个表资料的x2检验1适用条件:(1) 两

26、组对象其他方面同质(2) nM40, TM52. 计算步骤:(1) 建立检验假设H :n =nH : n尹(2) 计算检验统计量专用公式:(a + c )b + d )6 + b )C + d ) v =1若出现nM40,而1 WT5时,需校正校正公式:或:X2 二(3) 确定P值,作出推断(查P475附表8)(PS:若n40或T1,只能用Fisher确切概率法检验,其他两种情况也可用, 最精确但是计算较为繁琐)第二节 多个独立样本RxC列联表资料的检验1. 用途:多个率的比较或多个频率分布的比较2. 适用条件:(1) R组对象其他方面同质(2) 不能出现T1的格子(3) 1WT50)当相持较

27、多时,采用如下校正公式:第二节 两组独立样本比较的秩和检验1. 两组连续性变量资料的秩和检验(1)建立检验假设H :两个总体分布位置相同H0:两个总体分布位置不同(1 2)编秩:混合、统一编秩(同组相等,顺次编秩,异组相等,平均秩次)(3)计算检验统计量T 查表法(nW50):查P477附表10统计量为样本量较小一组的秩和,n为样本量较小一组的样本量 正态近似法(n50)I F- W1(V + 1)/7 I -0.5 Q叭十相持25%时,需校正匚1 = 1-艺- N)仃为第j个相同秩诙的个数。N=n +n122. 两组有序分类变量资料的秩和检验(步骤同上)PS:必须校正3. 多组独立样本比较的

28、秩和检验(Kruskal-Wallis H检验)多组连续变量资料多组有序变量资料计算步骤:(1)建立检验假设H:多个总体分布位置或总体中位数相等H;:多个总体分布位置或总体中位数不全相等(2)计算检验统计量H: 编秩:原则同两独立样本资料 求各组秩和R:即各组秩次相加 计算统计量H值:H =-乞旦)一贺卅十I)U _ “(不要求记,会用即可)相持较多时需校正:U=丨一工(r;:戏第j牛相同秩枕的个数(3)确定P值,作出推断 查P478附表11H界值表(kW3.nW5) 查P475附表8%2界值表(v =k-1)第四节 随机区组设计的秩和检验(Friedman, M检验)计算步骤:(1)建立检验

29、假设H :多个总体分布位置相同H:多个总体分布位置不全相同(2)编秩:在各区组内由小到大编秩,遇相同取平均秩次,然后求各组秩和R(3)计算检验统计量M值:M =族打 JR2 -3b(k +1) (b为区组数,k为处理组数)(4)确定P值,作出推断(查P479附表12)第五节 多个样本间的多重比较(了解)1.完全随机设计多个样本间的多重比较(扩展的t检验法)计算步骤:(1)建立检验假设:H:第i组和第j组的总体分布位置相同H0:第i组和第j组的总体分布位置不同(2)计算检验统计量t值: 公式参见课本P182公式9-12(3)确定P值,作出推断a精确法(样本含量较小)b正态近似法(样本含量较大):

30、公式参见课本P183公式9-13 相持较多需用校正公式:参见课本P183公式9-14与9-15 此外,需对a进行校正多组间的两两比较:a =a/比较次数=2a/k(k-1)I实验组与同一对照组比较:a =a/ (k-1)校正2.随机化区组设计资料的多重比较(除计算公式与上述不同外,其余步骤均相同) 计算公式参见课本P184公式9-19第十章 两变量关联性分析 第一节 线性相关 1.适用条件:(1)双变量正态分布 (2)散点图有线性趋势2. 线性相关系数(Pearson积矩相关系数):(1)线性相关系数计算:相关系数=(沖丫的协方差)-r = 1J&的方差丿如勺方差丿工(x - x )(y - y )V匸1匸1r的绝对值表示两变量之间线性相关的密切程度r的正负值表示两变量之间线性相关的方向2)统计推断检验假设:H :P=00H :P 0 查表法:依据自由度v =n-2查P480附表13 回归系数t检验r-0r -0Sr3. 注意事项(1)散点图能直观看出两变量间有无线性关系,应先绘散点图(2)要求两变量都是随机变量,且仅适用于二元正态分布资料(3)出现异常值时慎用相关(4)相关关系不一

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!