医学统计学章节重点归纳

上传人:jin****ng 文档编号:199822824 上传时间:2023-04-12 格式:DOCX 页数:7 大小:41.91KB
收藏 版权申诉 举报 下载
医学统计学章节重点归纳_第1页
第1页 / 共7页
医学统计学章节重点归纳_第2页
第2页 / 共7页
医学统计学章节重点归纳_第3页
第3页 / 共7页
资源描述:

《医学统计学章节重点归纳》由会员分享,可在线阅读,更多相关《医学统计学章节重点归纳(7页珍藏版)》请在装配图网上搜索。

1、医学统计学章节重点归纳第一节 概述1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗 保健制度和管理中的统计问题)。2、卫牛统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。5、变异:是指客观事物的多样性和不确定性。6、变量:观察单位的某种特征,称为

2、变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。9、概率:事件发生的可能性大小的量度,通常以符号P表示。10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。第二节数值资料的统计描述1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。3、集中趋势指标:算术平均数(均数)、几

3、何均数、中位数。指标使用条件计算公式算术平均数适用于正态或近似正态分布厂w “的数值变量资料中位数 非正态分布资料(对数正 态分布除外);频数分布 的一端或两端无确切数据的 资料总体分布不清楚的资 料。旳为奇数,二為曲“ 2总为偶数,几何均数对数正态分布,即数据经y过对数变换后呈正态分布的 G 临坦+坦丸;)=返(仝里一)资料;等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。计算公式指标计算公式主要优缺点4、离散型趋势指标:极差、标准差和变异系数极差R=Xmax-Xmin离均差平反映了各变量值之间的变异情况,但单位是原观察值单位的平方和空“憨=工 3-才尸=更环易理解,同时又受观察值

4、个数的影响,不利于比较。方差反映了各变量值之间的变异情况,不受观察值个数的影响,但 单位是原观察值单位的平方,不易理解。1标准差S =变异系数= =xlOO%反映了各变量值之间的变异情况,不受观察值个数的影响,单 位与原观察值单位相同,是最常用的离散程度指标之一,但在两 组合多组资料比较时,常受到计量单位不同和均数相差很大的影响而不能比较和不便于比较。反映了各变量值之间的变异情况,不受观察值个数的影响,没 有单位,用于比较度量衡单位不同或均数相差悬殊的多组资料的 变异度。5、正态分布下面积分布规律标准正态分布时区间(-1,1 )或正态分布时区间(片1G卫+1G )的面积占总面积的68.27%;

5、标准正态分布时区间(-1.96,1.96)或正态分布时区间(片1.96g,卩+1.96g)的面积占总面积的95%; 标准正态分布时区间(-2.58,2.58)或正态分布时区间(片2.58g,p+2.58g)的面积占总面积的99%。6、正态分布的应用。a、医学参考值范围b、质量控制c、正态分布是其他一些理论分布的极限形式。 第三节总体均数的估计和t检验1、均数的抽样误差:由抽样引起的样本均数与总体均数之差。均数的抽样误差大小用标准误来描述。标准误。bs-=。一般不知道总体均数。,可用样本标准差S来代替:S-=x nx 斗 n2、标准差与标准误的区别与联系:区别:标准差S (。):意义:描述个体观

6、察值变异程度的大小。标准 差小,均数对一组观察值得代表性好;应用:与X结合,用以描述个体观察值的分布范围,常用于医学参考 值范围的估计;与n的关系:n越大,S越趋于稳定;标准误S X(。X):意义:描述样本均数变异程 度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;应用于X结合,用以估计总体均数 可能出现的范围以及对总体均数作假设检验;与n的关系:n越大,S越小。联系:都是描述变异程度的指 s标;由S-二 可知,S-与S正比。n 定时,s越大,S-越大。x JnXx3、t分布:当X服从均数为卩的正态分布时,统计量t =兰二二服从自由度为v=n-1的t分布,是小样本总体均s Jn

7、数的区间估计及假设检验的理论基础。4、t分布的图形特征:t值得分布于自由度有关。t分布只有一个参数即v。特征:单峰分布,以0为中心,左右对称;v越小,t值越分散,曲线的峰部越矮,尾部越高;随着v逐渐增大,t分布逐渐接近标准正态分布; 当v趋向a时,t分布趋近标准正态分布,故标准正态分布是t分布的特例;t分布是一簇曲线。5、一般正态分布转化为标准正态分布就是将变量X转变为标准正态变量Z值。Z= (X- X ) /So6、 小样本均数可信区间:总体均数卩的双侧(1-a )置信区间为X 土tS-;单侧(X -t S-,a )或a/2, v Xa,v x土t S-0.01, v xX 2.58 S-(

8、-a, X + t S)o95%的可信区间:X 土tS;卩99%的可信区间:Xa,v x0.05, v x7、大样本均数可信区间估计:卩95%的可信区间:X 1.96S-;卩99%的可信区间:XX8、t 检验主要用于两组均属的比较,它能够判断进行比较的两个均数的差别是由于抽样误差引起,还是来自不 同总体。9、t检验应用条件:资料是数值资料分析目的是对两均数进行比较样本例数较少时,资料服从正态分布, 做两样本均数比较时,要求两总体方差齐。10、样本均数与总体均数比较的t检验:d u d 0 d11、配对设计的t检验:t = 齐=s- s /Jn s gndddX x12、两样本均数比较的u检验,

9、两样本均数比较时,如n和n均大于100,可用Z检验。Z =112Is2 s2n n1 1 2 第四节 方差分析1、方差分析应用:a、两个或多个样本均数的比较b、分离各有关因素并分别估计其效应c、分析两因素或多因 素的交互作用d、方差齐性检验2、方差分析包括:a、完全随机设计的方差分析b、随机区组(配伍组)设计资料的方差分析c、均数间的两两 比较。3、方差分析表变异来源自由度均方F值总变异工工X2 CN-1ZMS组间/MS组内组间变异e(eX .) -cK-1SS /v组间组间组内变异SS SS SS组内总组间N-KSS 氏组内组内1C=(EEX ) 2/nij i1、方差分析基本条件:a、独立

10、性各样本是相互独立的随机样本b、方差齐性各组实验结果变异程度一致c、正 态性各组实验结果都服从正态分布第四节 分类资料的统计描述1、常用相对数包括:率、构成比、相对比2、 率:发生某现象的观察单位数率=x 100%率可能发生某现象的观察单位总数率又称频率指标,说明某现象发生的频率或强度,常以100%、1000%o等表示。3、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。构成比=x100%某一组成部分的观察单位数 同一事物各组成部分的观察单位总数4、相对比,是A、B两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲 指标/乙指标(或

11、100%5、动态数列常用指标:绝对增减量、发展速度、增减速度、平均发展速度、平均增减速度。6、标化率:在进行几个总率比较时,由于内部构成不同并影响了相互比较的结论时,采用统一的标准对几个总 率的内部构成进行矫正后在比较。校正后的总率称标化率或调整率。第六节 二项分布及其应用1、二项分布是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为n,阴性结果的发生 概率为(1-n);而且每个观察对象的结果是相互对立的,那么,重复观察1个人,发生阳性结果的人数X的概 率分布为而二项分布,记作B (n,n)o2、二项分布的概率函数P (X) =Cnx nx (1-n) n-x3、二项分布适用

12、条件:每次实验只有两种互斥的结果;各次实验互相独立;发生成功事件的概率恒定。4、分布特征:二项分布的特征由二项分布的参数n以及观察的次数n决定。图形分布特征:二项分布图的高峰在U=nn处或附近;n=0.5时,图形对称;工0.5时,分布不对称,且对同一 n, n离0.5愈远,对称性愈差。对于同一 n,随着n的增大,分布趋于对称。当n-s时,只要n不太靠近0或1 (特别是当nn和n (1-n )均大于5时),二项分布趋于对称。5、二项分布的均数和标准差:若X服从二项分布B (n,n),则X的总体均数为M=nn,总体方差为。2=n n(1- n)第七节 泊松分布及其应用1、Poisson分布:是一种

13、离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的 罕见事件发生次数的概率分布。一般记作P (入),入是Poisson分布的唯一参数。总体均数为入-nn。前提条 件:互斥、独立、恒定。2、概率函数为:P (X) =e-入,X为观察单位内稀有事件的发生次数,e=2.71828。3、分布特性:Poisson分布是非对称的,总体参数入值越小,分布越偏;随着入一s,分布趋于对称,当入习0 时, Poisson 分布资料可按正态分布处理。4、Poisson分布总体均数与总体方差相等,均为入5、Poisson分布的观察结果可加性,即对于服从Poisson分布的m歌互相独立的随机变

14、量X1、X2Xm,它们的 和也服从Poisson分布,其均数为这个m随机变量的均数之和。6、三种常用分布之间的关系: 二项分布与Poisson分布的关系:当n很大,发生概率n (或1- n )很小,二项分布B (n, n)近似于Poisson 分布P (nn); 二项分布与正态分布的关系:当n较大,n不接近0或1 (特别是当nn和n(1-n )均大于5时),二项分布 B (n,n )近似于正态分布N (n n, n n(1- n); Poisson分布与正态分布的关系:当入三20时,Poisson分布渐进正态分布N (入,入)。7、二项分布与 Poisson 分布的区别:相同点:都是离散型随机

15、变量的常见分布;区别:a、取值不同。服从二项分布的随机变量有n+1个不同的取值;Poisson分布的随机变量的可能去只有无 限多个,即非负整数0,1, 2;b、随机变量的概率不同:二项分布P (X=k) = ,Poisson分布P(X=k)=e-入; c、描述的随机变量不同。二项分布描述的是一次试验只会出现两种对立的结果之一,n次独立重复试验中某种 结果出现次数的概率分布。Poisson分布描述的是在单位时间、面积、空间等范围中某种事件发生数的概率分布。 第八节 卡方检验1、检验用途:常用于分类变量资料的统计推断,主要用途包括:单样本分布的拟合优度;比较两个或多个 独立样本频率分布;比较配对设

16、计两样本频率和两频率分布;推断两个变量或特征之间有无关联性。分为四 格表卡方检验、行*列表卡方检验、配对资料卡方检验。2、四格表资料的卡方检验:公式:3、四格表次来哦在下列情况四格表资料中有任何一个格子的理论数TV1或nV40;四格表卡方检验,所得 P值十分临近检验水准时,可以直接计算其概率做出判断。4、行*列表卡方检验要求:理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理 论频数小于1,否则可能会产生偏性。如果不满足此要求,处理方法有:增加样本含量(首选);结合专业 知识考虑是否可以将该格所在行或列与别的行和列合并,要根据样本特性来确定,但会损失信息;改用RXC

17、表Fisher精确概率法,可以用计算机软件实现。5、配对设计资料的X2检验:公式: 第九节 非参数统计1、非参数统计使用:a、资料不服从正态分布或分布未知b、只能以严重程度、优劣等级、效果大小、名词先后 来综合判断的有序分类资料。2、秩和检验目的:是推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。3、方法要点:将两组数据由小到大同一编秩,以样本列数小者为n1,其秩和为T,查T界值表确定P值; 正态近似法:当n110或n2- n110时,T分布接近均数为n1 (N+1) /2,方差为n1 n2 (N+1) /2的正态分布, 可用 Z 检验。4、注意事项:编秩中若有相同

18、的数据在同一组则依次编秩;若相同数值在不同组内,求平均秩次;当相持 出现较多时(超过 25),需使用校正公式。5、基本思想:假设含量为n1与n2的两个样本(且n1Wn2),来自同一总体或分布相同的两个总体,则n1样本 的秩和T1与其理论秩和n1 (N+1) /2相差不大,即T- n1 (N+1) /2仅为抽样误差所致。当二者相差悬殊,超 出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。第十节 直线相关与回归1、直线相关又称简单相关,用于双变量正态分布资料,它是从数量上研究两随机变量间相互关系密切程度的一 种统计方法。2、相关系数是线性相关条件下用来说明两个变量间相关关系的密切程度和

19、方向的一个统计指标。R=3、直线回归又称简单回归,它是描述与分析两变量间线性依存关系的一种统计方法。4、直线回归方程:F=a+bX5、回归系数假设检验: F=6、回归剩余标准差: Sy,x=y,x7、回归系数标准误: Sb=8、不要把相关关系都说成是因果关系。(伴随关系)9、不要把相关的显著性程度误解为密切程度。10、线性回归模型的适用条件:线性:因变量Y与自变量X称线性关系;独立:每个个体观察值之间互相 独立;正态性:任意给定X值,对应的随机变量Y都服从正态分布;等方差性:在一定范围内不同的X值 所对应的随机变量Y的方差相等。简记为LINE。11、线性回归的应用:用于计算总体条件均数的置信区

20、间以及总体回归线的置信带;用于计算个体Y预测 值及其预测区间。线性回归常用于统计预测和统计推断。12、线性回归与线性相关的区别与联系:区别: 单位:相关系数r没有单位,回归系数b有单位;所以,相关系数与单位无关,回归系数与单位有关; 应用目的:说明两变量间的关联性用相关分析,说明两者依存变化的数量关系则用回归分析; 对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服 从双变量正态分布的随机变量。 取值范围:-svbv+s, -1WrW1;意义:回归系数b表示X每增(减)一个单位时,Y平均改变b个单位; 相关系数r说明具有线性关联的两个变量间关系的密切

21、程度与相关方向;联系:方向一致:r与b的正负号一致;假设检验等价:tr=tb:;用回归解释相关决定系数(coefficient of determination):,回归平方和越接近总平方和,则r2越接近1,相关性越好。第十二节 调查设计1、调查设计是对调查研究所作的周密计划,包括资料收集、整理和分析全过程的设想和安排。2、调查设计包括内容:确定调查目的和指标、确定调查对象和观察单位、确定调查方法、确定资料收集方式、 拟定调查项目和调查表、估计样本含量。3、组织计划:调查员的挑选和调查员的培训。4、整理计划步骤:问卷接受、问卷核查、数据编码、数据录入、拟定整理表、归纳汇总等。5、常用的调查方法

22、有:直接观察法、采访法、报告法等。6、各种抽样方法的抽样误差一般是:整群抽样三单纯抽样三系统抽样三分层抽样。第十三节 实验设计1、根据研究者是否人为地设置处理因素,即是否给予干预措施,可将医学研究分为调查研究和实验研究两类。 调查研究:又称观察性研究或非实验性研究,确切的说应是非随机化对比研究。它对研究对象不施加任何干 预措施,是在完全“自然状态”下对研究对象的特征进行观察、记录,并对观察结果进行描述和对比研究。 实验研究:又称干预性研究,是对研究对象人为给予干预措施的研究。2、实验设计的基本要素:受试对象、实验因素、实验效应。受试对象:是处理因素作用的客体,根据受试对 象不同,实验可以分为三

23、类:动物实验、临床试验、现场试验。实验因素:是研究者根据研究目的而施加的 特定的实验措施,又称为受试因素。实验效应:是处理因素作用下,受试对象的反应或结局,它通过观察指 标来体现。3、选择观察指标时,应当注意:a客观性:客观指标具有较好的真实性和可靠性;b精确性:包括准确度和精密 度两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响。精密度指相同条件下对同一对象的同 一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。c灵敏性和特异性:指标的灵 敏度反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应更好地显示出来;指标的特异度反映其鉴别 真阴性的能力,特异

24、度高的指标不易受混杂因素的干扰。4、实验设计的基本原则:对照、随机化和重复。(1)对照的形式:安慰剂对照:目的:在于克服研究者、受试对象等由心理因素导致的偏倚。空白对照:即对 照组不接受任何处理,在动物实验和实验方法研究中最常见,常用于评价测量方法的准确度,评价实验是否处于 正常状态等。实验对照;标准对照:用现有标准方法或常规方法作为对照;自身对照:对照与实验在同一 受试对象身上进行。(2)a随机化体现在三方面:随机抽样:总体中每一个体都有相同机会被抽到样本中来;随机分配:每个受试 对象被分配到各组的机会相等,保证大量难以控制的非处理因素在对比组间尽可能均衡,以提高组间的可比性; 实验顺序随机

25、:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。b在实验设计中常 通过随机数来实现随机化。获得随机数的常用方法有:随机数字表和计算机的伪随机数发生器。随机数字表常用 于抽样研究及随机分组。 c 常用的两种随机化分组的方法:完全随机化和分层随机化(配对随机化和区组随机化 可看成是分层随机化的实际应用)。重复包括三种情形:整个实验的重复;用多个受试对象进行重复;同一受试对象的重复观察。重复的主 要作用:估计变异的大小;降低变异大小。5、常用的实验设计方案:1完全随机设:又称简单随机设计,是最为常见的一种考察单因素两水平或多水平效应的实验设计的方法,它是 采用完全随机分组的方法将

26、同质的受试对象分配到各处理组,观察其实验效应。2配对设计:是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同的处理组。据以配 对的因素应为可能影响实验结果的主要混杂因素。配对设计主要有以下情形:将两个条件相同或相近的受试对 象配成对子,通过随机化,使对子内个体分别接受两种不同的处理;同一受试对象的两个部分配成对子,分别 速记地接受两种不同的处理;自身前后配对,即同一受试对象,接受某种处理之前和接受该处理后视为配对。 配伍组设计:实际上是配对设计的扩展。通常是将受试对象按性质相同或相近分为b个区组(或称单位组、配 伍组),再将每个区组中的k个受试对象随机分配到k个处理组。设计

27、应遵循“区组间差别越大越好,区组内差 别越小越好”的原则。6、样本含量的估算:1确定样本含量的原则:在保证研究结论有一定可靠性的前提下,估算最少需要多少受试对象。 2假设检验所需样本含量取决于四个要素: 第一类错误概率a的大小:a越小,所需样本量越大;第二类错误概率B或检验功效(1-B )的大小: 第二类错误的概率越小,检验功效越大,所需样本含量越多;容许误差5:即两总体参数的的差值,5越大, 所需样本含量越小;总体标准差。和总体概率n:。越大,所需样本含量越多;总体概率n越接近50%,变 异性越大,所需样本含量越多。第十四节 居民健康统计1、反映生育水平的指标包括:粗出生率、总生育率、年龄组

28、生育率。a、粗出生率是指某地某年平均每千人口中 的出生数,说明一个地区人口的生育水平b、总生育率是指某地平均每千名育龄妇女(15-49岁妇女)的活产总 数。c、是按年龄别计算的育龄妇女生育率,它消除了年龄构成对生育水平的影响,可了解计划生育控制的重点 人群,但不能反映某一时空范围的总生育率情况。2、人口死亡统计指标:粗死亡率、年龄别死亡率、标准化死亡率、婴儿死亡率、新生儿死亡率。a、粗死亡率: 某地某年死亡总人数/同年平均人口数xK反映一个地区居民死亡水平,但受当地人口、年龄、性别构成影响, 须标化后才能进行比较b、年龄别死亡率:某年某年龄组死亡人数/同年同年龄组平均人口数xK可与他地相应 年

29、龄别死亡率直接比较,但也受性别构成影响。一般以5岁为一组距,不满一岁者归0组,14组又为一组, 以此为据推算寿命表c、标准化死亡率:消除了年龄结构对死亡水平的影响,可用于比较年龄结构不同的人群整 体死亡水平d、婴儿死亡率:某年平均每千名活产数中不满周岁婴儿的死亡数。e、新生儿死亡数:是某年平均 每千名活产数中未满28天新生儿的死亡数。3、寿命表是描述特定人群生命过程的一种统计表,分为定群寿命表和现实寿命表。 用于评价人群健康状况和社 会卫生水平;用于评价某种(类)疾病对于居民寿命的影响。4、发病率是指在一定时期内,在可能发生某病的一定人群中新发某病的频率指标。5、患病率也称现患率,指某时点上受检人群中患某种疾病的人数,通常用于描述病程较长或发病时间不宜明确 的疾病的患病情况。6、某病死亡率又称疾病别死亡率,指某年每10 万人中因某病死亡的人数。7、生存率:指病人能活到某一时点的概率。(直接法和寿命表法)8、n年生存率=活满n年的合计病人数/随访满n年的累计病人数*100%

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!