流行病与统计学方法基本原理

上传人:s****a 文档编号:198733722 上传时间:2023-04-09 格式:DOCX 页数:10 大小:33.40KB
收藏 版权申诉 举报 下载
流行病与统计学方法基本原理_第1页
第1页 / 共10页
流行病与统计学方法基本原理_第2页
第2页 / 共10页
流行病与统计学方法基本原理_第3页
第3页 / 共10页
资源描述:

《流行病与统计学方法基本原理》由会员分享,可在线阅读,更多相关《流行病与统计学方法基本原理(10页珍藏版)》请在装配图网上搜索。

1、流行病与统计学方法基本原理(本节主要面对学习过流行病学与卫生统计学的读者,故对教课书中详述的概念和名词 定义不再重复,对有关的公式和计算方法也不涉及。必要时,读者可以参考相应的教课书。 为避免翻译不同的误解,某些名词同时给出了英文。)流行病与统计学方法基本原理可以简述为:用收集、整理、和分析观察数据资料的方法, 从群体和环境的宏观角度来研究有关健康问题,为公共卫生的实际需要服务。1662年英国学者John Graunt (1620-1674)发表了著名的文章“基于死亡资料的观 察”(Natural and Political Observations on the Bills of Morta

2、lity),第一个用数据资料来研究生命 问题,常被称为生命统计的奠基人,若单从方法学来回顾这段历史,也可以看作是流行病学 与卫生统计学方法的共同起点。他在处理大量数据的分析中,阐明了四个重要的现象-第一, 他记录下了在个体中好像是偶发事件(起码在我们现有知识水平上,看来是偶发事件),而在 群体上却呈现有规律变化的生命现象。第二,他第一个指出人类在孩子出生时男性多于女性。 第三,他描述了人类幼年时期,有着相对较高的死亡率。第四,他发现当时伦敦城市死亡率 高于乡村地区。此外,他还建立了雏形的寿命表。(6)他的这段工作体现了,以定量数学为 主要工具,从社会环境群体现象的角度,来研究有关:健康)问题,

3、而这正是流行病与统计学 方法的精要。瑞士数学家J. Bernoulli (1654-1705)提出了 “大数法则”,法国数学家P S Laplace (1749-1827)促成概率论为数学一个分支,开辟了数理统计学,(10)从而为应用统计 学(包括卫生统计学)提供了严谨的数学基础,大大地丰富了收集处理观察数据资料的统计理 论和方法。近年来计算机和信息科学的发展为统计理论和方法更进一步地开拓了广阔的天 地。著名的John Snow (1813-1858)在1854年对霍乱爆发流行的研究方法,是现代流行病学 方法的先驱,Snow把发病与周围环境状况结合在一起,早Koch发现霍乱弧菌30年,从数 量

4、研究群体和环境的宏观角度找到了霍乱的传播途径,解决了那次霍乱爆发流行预防与控制 问题(6)。随着流行病与统计学方法在防控各种传染病、慢性非传染病、环境和职业卫生问 题、公共卫生应急事件处理、以及公共卫生干预计划的制定、实施和评价中广泛地应用,此 方法也得到了发展,成熟为一门公共卫生的基础学科,对促进以“证据为基础公共卫生决策” 和“循证医学”的形成,起到了关键性的作用。流行病学的一个显著的根本性特点,是以每一个人为基本单位,研究的范围是健康(卫 生)问题在由多个个体(单位)组成的群体以及此群体生存宏观环境中的现象和相互联系,有别 于把每一个人做外延的终点向身体内研究其系统器官组织分子的基础医学

5、诸科,也有别于研 究微观环境科学中的诸学科(例如,微生物学和环境毒理学)。流行病学的另一个根本性特点 是它的实用性,为公共卫生的实践决策需要服务:流行病学工作者常常不可能(像实验室工 作者那样),去“安排”卫生事件或环境,而只能充分利用当地现实可行的方法,去发现并解 决当地的公共卫生问题,所以,流行病学又被称为公共卫生中“运用可行方法的艺术” (2)。 流行病学工作者经常性工作是从当地各种公共卫生问题在特定的不同时间、空间、和人群间 分布差异入手,发现主要的公共卫生问题,并找到可以干预的影响此公共卫生问题分布的因 素,提出相应的可行决策,从而达到为控制此公共卫生问题的实践目的。此外,流行病学的

6、发展始终与统计学的进展紧密相伴。流行病学发展中的需求,不断地 给统计学提出了挑战,而统计学的进展又为流行病学提供了定量描绘和分析群体卫生事件及 其影响因素的支持性工具技术。虽然近年来流行病学越来越多地涉及人类行为的研究,加之 地理全球定位系统(GPS)的进展,社会学和人类学现场的“定性研究”也与传统的统计学定量 方法结合在一起应用于公共卫生,但是,流行病学与统计学方法紧密结合,运用数学定量方 法来处理卫生问题仍然是一个很突出的特征和主要的手段,常常合起来称为公共卫生中的 “流行病与统计学方法”(2)。我们可以从下面五个方面展开简述流行病与统计学方法基本原理:(1)流行病与统计学方法起于观察与测

7、量卫生事件,原始数据的质量控制是公 共卫生决策的基础(2)公共卫生实践在于不断地运用流行病与统计学方法提出假说,并检验假说(3)医学与公共卫生中的随机现象,偶然性大小的概率估计以及各种统计技术 工具的作用(4)复杂群体现象的因果图和偏倚分析(5)人类独特强大的霍桑(Hawthorne)效应和“安慰剂”作用流行病与统计学方法起于观察与测量卫生事件,原始数据的质量控制是公 共卫生决策的基础流行病与统计学方法的第一步,就是对疾病、死亡、健康问题或卫生事件,在明确定义 的基础上,相对于其发生的时间、空间和人群,通过观察测量而赋予数字或数值。可以赋值 的范围称为变量的定义域。对变量所赋予的数字,只不过是

8、一个数学符号,同一个数学符号 在不同变量中代表的意义,可能完全不一样。按变量可赋予数字值的性质,变量可分为两分、 计数、等级、和计量(计量还可按有无绝对0点、及连续还是离散细分)四类,其中两分变 量只可赋值为0或1,既可以看作是计数变量又可以看作是计量变量。通过改变赋值的方法, 一个计量变量可以转换成等级变量,一个等级变量可以转换成计数变量;但是,反方向的转 换却是不可能的。对疾病、死亡、健康问题或卫生事件初次赋值,就可得到有关变量的绝对数,两个绝对 数通过一次除法运算得到的数,称为相对数。人群中的疾病、死亡、健康问题或卫生事件, 除少数罕见疾病用绝对数之外,多用相对数指标来测量。常用的相对数

9、指标有四类(8):构成比(例)-例如,时点患病率(prevalence rate)和时点感染率,它们是人群(时间点) 静态内部某构成部分,(患病者,阳性者),占观察人群全体(某时点总人口数,受检者总数) 的比重。无量纲,取值在零到壹闭区间内,反映构成概率。发生(频)率-例如,累积发病率(accumulative incidence rate)和累积死亡率,它们是 一种发生比例,反映在一定的观察时间内人群中新发生(某病,死亡)者占全体观察人群的 比例,是发生频度。无量纲,取值在零到壹闭区间内,反映发生概率。速率指标-例如,风险函数(hazard function),是时点死亡率或死亡力(forc

10、e of mortality),用于寿命表分析。量纲为时间的倒数,取值在零到无穷大,反映的是死亡发生的 时点死亡密度,不是概率。类似的还有发病密度 (incidence density)或发病力(force of morbidity) o比(ratio)-例如,比数(Odds),是发生(或构成)某事件的概率与不发生(或非构成) 此事件的概率之比值。分子分母是分离的互不包含,量纲可有/可无,取值由具体的情况而 异,反映的是分子分母对比的指数关系。在实际应用中为了便利,有多种近似地估计方法,如用观察期间的平均患病率估计来表 示时点患病率估计值,在此四类基本相对数指标基础上可以派生出多种指标。例如,

11、相对危 险度(Relative Risk-RR)和比数比(Odds Ratio-OR),反映了暴露与疾病之间相关的强度等 等。判断某个指标的性质一定要依据它是如何测量赋值的,而不能由它的名称猜测。我们可以用某病为例,说明流行病与统计学方法中四类最基本的相对数指标和相互的关 系-患病率,发病率,发病密度和疾病比数。如何定义某病是测量病例(相对数分子)的基础, 第一步是对此疾病给予明确的定义,而后进一步明确(存在或发生)这些病例相关的人群(相对 数分母),从而得到两个基础性相对数指标:构成比(例)-用观察期平均患病率来表示的(时 点)患病率,和发生(频)率-一定观察时间内的(累积)发病率。在此基础

12、上,把发病率作为 一个连续性变量而对其求时间的导数就可以得到时点发病密度,而时点患病构成比数=时 点患病率/(1-时点患病率),(观察时间内)疾病发生比数=(累积)发病率/(1-(累积)发病率)。对 某个稳定人群而言,当观察期短并且发病人数远远小于全体观察人数时(大多数疾病满足此 条件),在此观察期发病密度恒定,则上述四类基本相对数指标有下面的关系:(平均)时点患病构成比数=发病密度*平均患病时间;累积发病率=发病密度在观察期的积分=1-EXP (发病密度*观察时间)。由此还可以近似地估计:时点患病率=发病密度*患病时间;累积发病率=发病密度*观察时间。收集数据的方法可以间接引用常规报告或现存

13、资料,也可以直接来自观察检测、调查、 公共卫生监测或筛查。原始数据的真实、可靠和精确,决定了结果的真实、可靠和精确。所 以,整个资料的收集过程,包括记录、计算机录入、校对、整理、归纳,都必须实行全面质 量保障(total quality assurance)。最后,还应对测量的结果(赋值)开展有效性(validity)和可 靠性(reliability)分析判断。测量的有效性,有时也翻译为真实性或效度,指的是测量得到的 数值反映真值的程度;而测量的可靠性,有时也翻译为可重复性或信度,指的是反复测量同 一真值得到的数值之间的一致性大小。真值常用所谓的“金标准”来表示。可靠性不是有效 性的充分条件

14、,但却是有效性的必要(前提)条件。在理化测量中常称测量的有效性为准确度 (accuracy)、可靠性为精密度(precision) 0当真值是个确定的常数时,多次反复测量同一真值得到的大量测量值的总方差等于系统 误差方差与随机误差方差两者之和。随机误差是指测量无法避免的、均数为零、呈正态分布 的偶然性误差。所以,系统误差方差占测量总方差的比例就是其可靠性的指标,越大可靠性 越差。而测量值的均数与真值的差,为绝对测量误差,绝对测量误差与真值的比为相对测量 误差,都是有效性的指标,测量误差越小其测量的有效性越好。当绝对测量误差为零时,有 效性最好,反映本测量为无系统误差,称为无(系统)偏倚测量;反

15、之,当绝对误差不为零时, 称此测量为有偏倚的测量,绝对误差为正值时称为高估偏倚性测量,绝对误差为负值时称为 低估偏倚性测量。有效性分析判断时,要判断有无系统误差、系统误差的方向及大小(即偏 倚是否存在?若有,其方向和大小如何)。当测量的变量是两分变量时,可靠性的指标常用Kappa值,而有效性常用敏感度(sensitivity)和特异度(specificity)来评价。当测量的变量是计量变量时,可靠性常用两次独离 测量值的相关系数来评价;有效性常用变量对测量值的回归系数来评价。当真值是个随机变 量时(10),测量值的总方差等于真值方差加系统误差方差加随机误差方差三者之和。可靠 性的指标可定义为真

16、值方差与系统误差方差之和占测量总方差的比例,越大越不可靠;有效 性定义为真值方差占测量总方差的比例,越大越有效。当没有“金标准”,真值无法得到时, 可靠性只能用测量本身的可重复性来评价,而有效性也常用表面效度face validity).内容效 度(content validity)和结构效度(construct validity)来估计。(注:另有常用的区分效度 (Discrimination validity)-本 质是一种结构效度)公共卫生实践在于不断地运用流行病与统计学方法提出假说,并检验假说运用恰当的图表来描述健康问题或卫生事件在不同人群间、不同时间、和不同环境空间 中的分布是流行病

17、与统计学方法的基本功。临床病例观察与报告、公共卫生监测、普查、筛 查和抽样断面或患病率调查、观察性纵向研究等都是这一类的描述流行病学。所谓的分析流 行病学研究,多指对比性观察研究,例如,生态学相关性研究(Ecological correlation studies)、 对比性断面调查研究或患病率比较研究、病例-对照研究和其他衍生类型、和前瞻性队列研 究及其他类型的队列研究。描述流行病学和分析流行病学中的各种类型的研究都有一个共同 的特征-非试验的观察性研究,这类研究的“自我选择偏倚”的天然特性使之很难“证明” 一个因果关系的存在(2),但是,却可以合理地产生为公共卫生的决策和进一步设计试验性

18、研究提供有价值的因果假说,还可以用以支持(或不支持)某个已经存在的因果假说,从而增 强了 (或减弱了)此因果假说的可能性。公共卫生是一门实践的学科,经常要在不确定性的条 件下立刻采取某种干预行动,尤其是在现场应对突发卫生事件(如疾病爆发、急性中毒和传 染病流行)中更是如此。对这类公共卫生干预活动开展流行病与统计学方法指导下的设计和 评估,加上其他经过详尽准备的符合流行病与统计学方法良好设计的试验性和评估研究一 起,组成了以假说检验为特征的(试验)干预流行病学”和“评估流行病学”,其中包括类试 验研究(Quasi-experimental studies域无平行对照的干预项目、非随机对照试验或非

19、随机平行 对照的干预项目、随机对照社区干预试验和随机对照试验(Random Controlled Trial, RCT)。假说的产生永远只能是“合理的猜测艺术”。假说产生(hypothesis generating)性研究不是 单纯的描述,也不是单纯的分析,而是有描述分析、又有评估判断的综合过程。它常常要把 各种来源的资料整合在一起来描述、比较、分析、评估、判断,从中引出某些推论或假说。 产生的假说可信度依赖于它引用的资料性质来源和推理方法,流行病与统计学方法提供了运 用现有的资料和可行的途径(设计)产生假说的思路方法,但是,它只能帮助我们如何去“合 理的猜出”,却无法教会我们如何去“合理的推

20、出”,可信度高的假说。假说检验(hypothesis testing)性研究,是严格的逻辑推理和经验实证的考核过程。或用现 有资料,或引用设计新的(干预)研究方案并实施此方案获得新的信息,在此基础上,运用严 格的逻辑推理对某假说在多大程度上可能是对的(即逻辑的矛盾存在提示了假说的缺陷),运 用实践经验进行“否证(falsify)”此假说的检验判断(即经验结果可以否定某假说,虽然无法 “证明”一个假说)。流行病与统计学方法提供了评估各种来源资料的原理,以及检验公共卫 生实践意义上的因果假说推理方法,可以说是一门公共卫生实践中的“群体生态思维推理方 法学”。以“描述流行病学”和“分析流行病学”为主

21、的假说产生性研究,目的在于找到既可以 合理解释卫生事件分布差异,又可以实施公共卫生干预的因素,从而为公共卫生决策提供了 合理可行的参考选择,又为以“(试验)干预流行病学”和“评估流行病学”为主的假说检验性 研究打下基础,明确定义了的需要检验的假说。而实施公共卫生干预及假说检验性研究的结 果,又为进一步假说产生性研究提供了素材。就这样,假说产生和假说检验互相结合在一起, 交替进行构成了整个公共卫生实践过程。流行病与统计学方法,为此过程是建筑在以“证据” 为基础上的,做出了重要贡献;反过来,以“证据”为基础的公共卫生实践,又推动了流行 病与统计学方法的发展。在实际工作中,有许多中间状态和综合性研究

22、,按照具体设计和实施的状况,不难对其 性质给予评估。实践也不可能等待百分之百的把握才去决策,公共卫生和医学中的干预决策 总是在一定风险概率下带有探索研究性的。每种研究都有自身的优点和限制,而每个具体研 究又随实际情况,各有差异。不涉及某研究详细的设计和实施的细节,是无法判断此研究的 具体价值和意义的,所以,我们只能就研究类别对因果推论有效性价值贡献大小为条件做一 般地讨论。任何来源的资料,原则上都可以用来进行假说的产生,或假说的检验。但是,从设计的 原始目的而言,公共卫生(试验)干预类研究主要是假说检验性研究,其中以良好设汁的随机 对照试验,假说检验性价值最高,其余的则假说检验价值顺序下降。对

23、比观察研究中的队列 研究和病例-对照研究,对比性断面调查研究、生态学相关性研究、观察性纵向研究以及断 面调查和公共卫生监测资料,也常用来对某假说进行检验,但是,其假说检验性价值较低, 它们和其他单纯描述研究一起,主要还是用于假说产生性研究,而其中队列研究和病例-对 照研究,在公共卫生假说产生中价值最高,其余的则价值顺序降低。1976年英国心理学家Glass命名的Meta分析(常译为系统整合,荟萃分析或汇总分析), 现在发展成一种全面系统收集文献,严格评估,减少偏倚,估计误差,力求推论的客观真实 可靠的综合分析(1)。由Meta分析在定量地整合多个随机临床试验上的总疗效,逐步推广到 整合对某诊断

24、效度的估计,整合多种对比性观察研究,得到的综合相对危险度(RR)或比数比 (OR),以及从多个描述性研究,得到整合的发病率或病死率。现在,这种系统整合从定量 扩大到定性,要求假说的产生是最大限度地合理(全部证据基础上)的猜测,并且,包括误差 与偏倚分析,以及对结论的敏感性评估。科学的发展总是在合理的猜测与严格的检验交替中前进,而且始终保持着批判性的怀疑 眼光暂时接受某假说,随时准备着按照新发现的事实,修正或推翻己经接受了但是却被事实 否证了的假说,转而接受“到目前为止,没有被否证的假说”,或者开始新一轮的假说猜测 与检验征途。流行病与统计学方法对公共卫生和医学的主要贡献之一,就是引入了这种以

25、“证据”为决策基础的思维范式(paradigm)。其中流行病和统计学家的主要职责,可以用一句 话来概括,那就是:收集已有的相关资料,通过描述和分析这些证据”,和其他专业同事们 一起讨论,做出合理的推论或对某假说设计出可行的检验方案,供下一步公共卫生和医学的 决策参考。医学与公共卫生中的随机现象,偶然性大小的概率估计以及各种统计技术 工具的作用公共卫生和医学中的许多事件可以有多种的结果,这类事件在个体上会有什么结果呈现 为无规律,但是,当这种个体无规律的事件在随着观察由此个体组成的群体量增加时,该事 件各种可能结果会发生的可能性却呈现出确定性分布规律。概率是可能性的数学表达,它是 一个可以取值(

26、定义域)在0到1闭区间的无量纲的数,当某结果发生概率等于1时,此结果 绝对发生,而概率为0时,此结果绝对不发生,否则,发生此结果的可能性处于0到1之间。 发生某结果概率为0或1的事件,称为确定性事件,而在个体结果呈现为无规律,而群体呈 现多种结果有确定性概率分布规律的事件,称为随机偶然事伟简称随机事件),若不但个体 呈现为无规律,群体也不呈现确定性概率分布规律的事件,称为混沌(chaos)事件。群体呈现 的多种结果概率分布,就是对个体发生该事件的各种可能结果可能性大小的估计,或者说是 对此随机事件偶然性的估计。例如,群体身高得到的均数,是此人群身高在个体最大可能性 出现的数值;从群体得到的患病

27、率、发病率和死亡率,反映了此群体每一个体患某病、发生 某病、及死亡的可能性,这些都称为相应的随机公共卫生事件统计参数。统计学提供了大量 可以定量地估计比较这类随机事件统计指标的技术和方法,从而公共卫生和医学中个体呈现 无规律的随机现象,就可以用概率的语言对偶然性大小进行估计,以群体呈现的统计参数来 定量地测量、描述、比较、分析和研究了。随机事件的概率本质,一直有两种不同的理解(3)。一种看法是-随机事件的多种可能 结果受到(总体)系统内部大量无法控制的因素影响,这些影响因素和它们的作用是确定的, 所以尽管在个体下无规律,而随着抽取样本量的增加,各种可能结果的相对频数的极限就是 概率分布,各种可

28、能结果的概率是随机事件(总体)系统的内在本质性特征,是随机事件(总体) 系统的一个物理常数与测量方法和系统外部无关。另一种看法是-随机事件各种可能结果的 概率是我们己知证据基础上的相信程度的度量,运用某测量获得证据之后的验后概率可以由 Bayes定理对验前概率进行测量似然函数(Likelihood function)修正而得,对随机事件各种 可能结果完全不知道时,Laplace提出了用等概率表示验前概率(Bayes公设),验后概率与 测量方法高度相关(正比于测量似然函数),随机事件的概率(分布)不是系统的内在本质性 特征,而是证据支持对随机事件各种可能结果某陈述的可相信程度。由第一种看法,统计

29、就 是分析获得的样本信息对总体特性进行统计推断的过程,由此诞生了 “推断统计学”,由样 本信息对总体参数作统计推断(Statistical inference)0而由第二种看法,统计是依据现有信息 来决策的假设检验过程,由此产生了 “Bayes统计学”,依据测量的似然函数在某假设可相 信程度下进行统计决策(Statistical decision making)。这两种观点都推动了统计学的发展,正 如物理学中既可以把光看作“粒子”,又可以看作“场”一样,采取N, Bonr的互补原理,我 们可以兼收并容,把统计技术既看作是对随机事件总体特性推断、又看作决策假设检验的工 具方法。在公共卫生中常用的

30、统计技术大致包括:计算各种公共卫生事件的统计指标及表达其 分布的图表统计描述技术、由样本信息估计总体参数的统计推断技术、比较样本统计指标统 计学显著性的假说检验、研究中的统计设计和各种统计模型分析。由于计算机和各种应用统 计软件的成功,现在公共卫生工作者很容易完成复杂的统计计算,关键在于理解各种统计方 法的应用假设条件、基本统计思想和原理,以及选择合适的统计模型。例如,由样本信息估 计总体参数的统计推断中,注意到只有比例可以直接按二项分布进行统计推断,而速率类和 比类指标一般不可以,同时样本应是按随机抽样于同质总体,这就包含了两个基本假设- 随机抽样和同质总体。我们必须清楚,什么是随机抽样,为

31、什么必须随机抽样什么是同质 总体,为什么必须同质总体。又例如,在应用各种统计模型并进行参数估计时,尤其是在应 用多变量统计模型时,我们应该掌握应用此模型的前提假设条件、它们的检验原理和方法、 所得参数的意义,才不会发生错误。多种统计技术对公共卫生中流行病与统计学方法的贡献,是工具性贡献,主要在两个方 面提供了定量工具-定量估计随机变异的大小,以及控制混杂作用和定量估计控制混杂后的 残存相关性大小。前者用的最多的是各种统计学显著性的假说检验,后者任务的完成,最多 的是分层统计技术或建筑在统计模型上的各种多元分析技术。统计学假说检验根本的目的只 是在于评估随机变异的作用有多大,所以,我们必须正确对

32、待所谓的统计显著或非常显著标 准(P-值不大于5%或1%),它们是历史习惯形成的,只有相对的意义,不是客观绝对的标准, 更不能代替生物学和公共卫生的考虑。此外,经验信息只能“否证(falsify)”某假说,而不 能“证实(confirm)”某假说,所以,统计学假说检验只能在一定可信度下去否证无效假设(null hypothesis),并在这个意义上且只在这个意义上接受备择假设(alternative hypothesis),具体地 说就是,因为无效假设通常是特异性高的假设,所以它才可能被现有给定信息否证,而备择 假设却有多种可能,用现有给定信息不但无法否证,而且只能由于无效假设被否证了,才使得

33、某些可能的备择假设相对为真的可能性增加了,仅此而已。运用分层统计技术去控制混杂 作用,常常要引用“加权(weight)”技术整合多个分层的指标估计值为一个加权平均估计值, 加权方法的选择是必须关注的;用多元分析技术来估计同时校正多个混杂因素后的残存相 关性大小时,统计学提供了选择统计数学模型的指南,而选择什么因素以及各因素用什么编 码方式进入此模型,却主要应来自流行病学和公共卫生实践的考虑。例如,为了预测的目的, 我们尚可以依赖逐步统计技术(stepwise statistical procedures),任由计算机来“自动”筛选自 变量,但是,当我们为了控制混杂作用为目的时,却不能单纯依赖逐

34、步统计技术筛选自变量, 而必须由流行病学考虑预设必须选入模型的自变量,而忽略逐步统计技术对其的选择。复杂群体现象的因果推理和偏倚分析因果概念涉及人类的全部生活,是哲学和各种科学学科有限的几个中心基本概念之一。 它的哲学含义和在各种科学学科中的定义都不尽相同,而且争议从未终止。这里谨从流行病 与统计学方法基本原理的角度,简述所谓的“流行病学因果推理”(Epidemiological cause-effect inference)-“那些能使人们发病概率增加的因素,就可被认为是疾病的病因,当 其中的一个或多个不存在时,疾病的频率就下降(9)。当某个公共卫生可干预性因素,被认 为是疾病的病因被公共卫

35、生干预控制后,若疾病的发生频率下降了,则从流行病学因果推理 上就认为此因素对疾病的因果关系得到了检验“证实”。它不同于直接实验性科学(例如,物 理和化学),也有别于基础医学各科(例如,病理和药理,致病微生物学和毒理)中的病因和因 果推理。目前科学上有在时空连续性基础上的因果定域(locality)公设,即某事件(结果)只能接受 在空间上与其定域相联的另一事件(原因)的影响,不存在(空间)超距作用、也不存在超光速 的(时间)传递。某事件(原因)的改变必然有(时空)路径(pathway)接触另一事件(结果)而“引 起”其变化。这个从原因到结果的(时空)路径,称为因果路径或因果机制。当因果路径中没

36、有中间事件时(即此原因直接与结果定域相联),此原因称为直接原因(第一代父事件),此结 果是直接结果(第一代子事件)。流行病学因果推理是要探索引起由个体组成的群体健康事件 的各种原因和可能的因果路径,在此健康事件发生之前直接与个体定域相联的因素都可能为 直接原因,通过这些直接原因而影响健康事件发生的其他因素都只可能为间接原因。流行病 学因果推理目的在于找到公共卫生可干预性因素及估计若控制了此因素会产生多大的效果, 而不在于去严格区分直接原因还是间接原因。D. B. Rubin在1974年提出了流行病学意义上的直接因果关系定义(5)-假设某个体A存 在一个完全相同的B,在时间t1同时对A和B施加干

37、预C和非干预C,在时间t2, A与B 反应值之差,定义为,在时段(t1,t2)内干预C相对于非干预C对个体A的因果作用。同理, 假设某总体A存在一个完全相同的总体B,在时间t1同时对A和B施加干预C和非干预C, 在时间t2,总体A与总体B平均反应值之差,定义为,在时段(t1,t2)内干预C相对于非干 预C对总体A的平均因果作用。因为完全相同的个体或总体都不可能存在,所以B是虚拟 的,Rubin的因果模型又称为虚拟事实模型。统计学中通径分析(path analysis),线性结构方程(Linear Structural Equation)和图论模型 (graphical models),曾用于流

38、行病学因果推理,但未获得较大的发展。Hill (1965)提出了九条 区分因果性相关(causal association)还是非因果性相关(non-causal association) 的标准。其中, 时间顺序(temporality)-时间上前因后果,明显是必须条件的绝对标准,但是,对于流行病 学观察性研究来说,许多因素发生的时间前后有时很难判断。其他的八条,都只是增加因果 的可能性而己,不是必须条件,更不能用这八条来否定因果关系的存在。例如,联系的强度 (strength)越大,留有未控制的偏倚或误差空间也大,所以越可能为因果性相关,但是,小因 果性相关常常因为样本量不足,相关性没有达

39、到统计学显著水平而被忽略(假阴性),只有提 高样本量和背景的同质,或者,在大规模的meta分析整合相关时才可能检出小强度的因果 联系。Greenland等(4)在上世纪末和本世纪初提出了用多群组分因果图(causal component diagrams)说明流行病学多种充分原因组合的因果推理和偏倚分析,指出传统的单因单果是特 例,并给出了计算在多因多果摸型下某单一原因对总结果贡献-病因分值(eti ologic fraction) 的方法。流行病学因果推理有两个维度:(1)从样本有效,即内部有效性(internal validity),至U总体 有效,即外部有效性(external vali

40、dity); (2)从一定假阳率(随机)误差估计下的统计学相关,经 过偏倚(系统误差)分析到流行病学因果。这两个维度结合起来,首先是样本必须具有内部有 效的相关性存在,统计学显著性假设检验提供了适宜的误差估计技术,第二步是在具有统计 显著相关性前提下,探索样本中为因果性相关的可能,Hill的九条标准,流行病学测量信息 性偏倚和样本混杂性偏倚分析提供了指南,从而完成了内部因果有效性推理;第三步是在内 部有效因果性相关存在时,推广到总体而进行的外部因果有效性评估,推断统计学给出了由 样本相关到总体相关的参数估计区间,流行病学要求从可能存在迭择性偏倚和总体混杂性偏 倚角度,对总体中因果性相关进行可能

41、性评估。这里再一次强调:用5%或1%假阳性率的 统计显著标准来决策,小因果性相关常常会被忽略漏掉。把Greenland多群组分因果图和Rubin因果定义结合起来,可知处理(暴露)组与对照(非 暴露)组共同包括什幺(除暴露外的其他)充分原因组分可以决定暴露因果性强度-称为流行 病学意义上的效应修饰(effect modification)作用,这些共同原因组分又称为暴露的效应修饰 因素,是因果本质特性;而处理(暴露)组与对照(非暴露)之间背景因素的差异,是产生暴露 特异因果作用的混杂必要条件(注意,不是充分条件),可能产生对暴露因果性强度的歪曲 (即混杂作用。所以,从相关性向因果性推理过程中必须

42、发现暴露的效应修饰因素,而必须 消除暴露的混杂因素。两者都可以“影响”暴露特异因果性强度,差别在于前者是因果本质 特性的修饰、后者是因果本质特性的混杂。当处理(暴露)组与对照(非暴露)组的背景因素完全分层后,可认为近似满足了 Rubin的 因果模型条件,这时每层内有效性中无混杂存在,检查层间相关强度有无显著性差异,尤其 是正负相关不同时,若有无显著性差异,表示有效应修饰作用存在。只有确定无层间效应修 饰作用,才可以把各层混合求出总平均相关强度,近似看作推广为总体抽样的外部因果有效 性评估的混杂校正后暴露因果性强度指标。注意,当前用来帮助确定无层间效应修饰作用的 技术是“统计交互作用分析”,当层

43、间相关之间无统计学显著差异时,表示无有效应修饰作 用存在才把各层混合求出总平均相关强度,这个方法有两个风险:一个是统计交互作用与选 择模型相关,而流行病学上的效应修饰作用,通常只在相加性模型中才有意义,另一个是这 里用了假阴性率为标准来决策,而当前的统计决策却是控制假阳率下的推断技术。混杂性偏倚是可以通过改善研究设计来控制,也可以用适宜的统计方法来校正,值得注 意的是,当混杂性因子在因果通路(causal pathway)上时,可能产生过度校正(over-adjusted), 此外,还应注意与效应修饰的区别(两者还可能会同时存在)。测量信息性偏倚和迭择性偏倚 无法只用统计方法来校正,必须通过提

44、高测量有效性和改善研究设计来控制。测量误差是不 可避免的,随机分布的测量误差降低研究的效力(power)但不产生偏倚,只有对比两组之间 不均分布才产生测量性偏倚;而用不适当的统计方法或由於失访/不回答产生的测量性偏 倚,直接扭曲样本中的统计指标估计,影响内部有效性。迭择性偏倚来自研究设计,它影响 外部有效性,观察性和描述性研究是最常用的流行病学研究,它们本身都固有“自我迭择性 偏倚”,只有用随机试验来控制。此外,还有所谓的“出版性偏倚(publication bias)和“迭择 性感知”,都是信息交流性偏倚,常常符合潮流或当事人期望的研究,才会发表或交流。当我们在文献综述或系统整合分析时,必须

45、注意这种偏倚的可能。人类独特强大的“霍桑效应”和“安慰剂”作用Elton Mayo(1949)发表了在美国Illinois州霍桑(Hawthorne)厂的一个研究报告,研究发现 人们被关注的本身,会影响被关注者的行为,从此,这类现象称为霍桑效应 (Hawthorne effect)。动物和人类中都存在霍桑效应,尤其以人类强大,来自工业管理研究表明:在个体 和群体水平上进行干预所产生的效益中,霍桑效应占10%到15%(6)。现在知道不论是医学 临床、实验室、还是公共卫生社区,都普遍存在霍桑效应。Beecher HK(1955)提请医学界注意安慰剂(placebo)作用:信仰的本身,会影响信仰者的

46、 生理生化过程。临床试验表明安慰剂大约对有关健康和疾病治疗总效果的影响平均有 35%(6)。安慰剂作用在人类生活中无处不在,可能在某些动物中也存在。社会文化可以通过 安慰剂作用,而影响健康和疾病的群体表现。虽然普遍相信在公共卫生问题的原因探索中或 干预的评估中,存在安慰剂作用,但是目前没有研究定量说明安慰剂作用的影响有多大。这是两类不同性质的心理暗示:霍桑效应产生于对外界人际关系的感知(他人暗示),而 安慰剂作用产生于内心自我的信念(自我暗示),后者强度大于前者。还有一些心理暗示包括 这两种的混合,例如,光晕效应halo effect)。常常这些心理暗示互相影响,而且还与躯体症 状反应交互影响

47、,例如,某患者,经专家讲述深信不疑轻度腹泻是“排毒”,可以改善他的 免疫功能,从而会少患感冒;此后他服用了被告知是“排毒”而实际是缓泻剂的药以后,缓 泻剂就可以通过霍桑效应(他人暗示)和安慰剂作用(自我暗示)与缓泻症状反应交互作用,产 生了少患感冒的“疗效”。心理暗示的作用大小与迭择什么测量指标有关,此外在不同人格 的人中对心理暗示反应差异很大,有的强有的弱,有人很容易被暗示,而有人很难被暗示, 同时文化背景和发生场景氛围对心理暗示的作用影响也很大。心理暗示的作用可能是正面 的,也可能是负面的,可表现为“疗效”,也可表现为“副作用”。当流行病学因果推理完成了某暴露与反应之间有因果性相关存在,并

48、估计出总因果性相 关大小强度之后,若有可能应进一步了解心理暗示对总因果性相关有多大的贡献,必要且可 能时,还应控制心理暗示对某特异的因果性相关产生的混杂作用,得到心理暗示校正后的特 异因果性相关。流行病学观察性研究,观察的本身就有霍桑效应,而安慰剂作用无处不在、 无时不在。控制文化有关的可测性指标,例如,性别、年龄、民族、宗教信仰、教育水平、 职业、和社会阶层,可以作为心理暗示部分的代理变量(proxy-variables),从而部分校正心理 暗示的偏倚。流行病学和统计学家,英国的Bradford Hill介绍了随机化双盲对照试验方法, 对临床和公共卫生做出了巨大贡献。随机化双盲安慰剂对照试验

49、,是当前唯一有效可行的方 法,能较好地控制并测量心理暗示对流行病学因果性相关的混杂性偏倚。对于诸多无法运用 随机化双盲安慰剂对照试验的公共卫生问题,只有通过细致的观察、综合的分析,以及参考 基础医学各科和心理学的研究成果,对其中可能的心理暗示作用进行估计。现在随机化双盲安慰剂对照试验已经在临床药物研究中得到了广泛地应用(7)。首先是 选择受试者,即药物的适应对象,而后随机化分配受试者到处理组或对照组,处理组全体受 试者都接受“标准化”的药物治疗,而对照组全体受试者都接受安慰剂治疗,受试者与接触 受试者的医护人员都不知道谁在处理组还是对照组,称为“双盲”。很明显盲法,可以控制 心理性测量偏倚,提

50、高内有效性,可以单独应用但是安慰剂对照同时必须要双盲,才能有 效排除安慰剂作用的偏倚,安慰剂对照组的组内效果就是安慰剂作用的样本估计值。随机化 分配可以排除主观分配造成的选择性测量偏倚和混杂偏倚,提高内有效性,还为meta分析 提供了必要的条件。随机化双盲安慰剂对照试验中安慰剂对照和处理两组,都有霍桑效应和 安慰剂作用(心理暗示),只不过在两组中平衡,结果无偏倚。心理暗示和其他均衡分配的混 杂因素在随机化双盲安慰剂对照试验中不产生偏倚了,但是却会降低试验的效力,扩大假阴 性的可能,给检验小效应药物增加了困难,这一点也必须清醒了解。从另外一个方面看,心理暗示也是一种公共卫生可干预性手段。它提示公

51、共卫生和医务 工作者,应该学习心理学知识、掌握并巧妙地运用各种心理暗示技术,才能理性而有效地完 成公共卫生和临床医务工作。小结公共卫生实践中的流行病与统计学方法基本原理,可以概括为-以群体生态思维的方 式,主要运用统计定量工具,从比较卫生(健康)事件在不同群体中差异入手,探索公共卫生 可干预性因素,达到为公共卫生决策服务的目的。它是集“思维”、“工具”、和“服务”三 位一体的方法学,既是“科学”又是“艺术”。它要求公共卫生工作者,深刻理解它的思维 方式、掌握它的各种工具技术、在实践中反复学习运用,才能真正掌握它并在自己的公共卫 生事业中发展它。参考文献(1) Charles Kerr, Ric

52、hard Taylor and Greg Heard edited( 1998): Handbook of Public Health Methods, McGraw-Hill Australia by, 1998(2) Detels Roger, James McEwen, Robert Beaglehole and Heizo Tanaka edited (2002): Textbook of Public Health, fourth edition, Oxford University Press, 2002 Oxford(3) Folks L.J. (1981): Ideas of

53、Statistics, John Wiley & Sons, 1981(4) Greenland, S., Pearl, J and. Robins, J.M. (1999a): Causal diagrams for epidemiologic research, Epidemiology, 10, 37-48, 1999(5) Rubin, D.B.(1974): Estimating causal effects of treatments in randomized and nonrandomized studies, J. Educ. Psychology 66, 688-701(6

54、) White K.L. (1991): Healing the schism-epidemiology, medicine, and the public health, Springer-Verlag New York Inc 1991(7)王若涛(1986):临床流行病学,中国医药科技出版社,1986(8)王若涛(1994):疾病分布的统计指标,见曾光主编“现代流行病学方法与应用” 第三章,北京医科大学与中国协和医科大学联合出版社,1994(9) 赵仲堂主编(2005)流行病学研究方法与应用科学出版社,2005(10) 柯惠新,黄京华,沈浩(1992):调查研究中的统计分析法,北京广播学院出版社,1992

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!