流行病学:研究中常见的偏倚及其控制

上传人:努力****83 文档编号:168882889 上传时间:2022-11-13 格式:PPT 页数:43 大小:404.50KB
收藏 版权申诉 举报 下载
流行病学:研究中常见的偏倚及其控制_第1页
第1页 / 共43页
流行病学:研究中常见的偏倚及其控制_第2页
第2页 / 共43页
流行病学:研究中常见的偏倚及其控制_第3页
第3页 / 共43页
资源描述:

《流行病学:研究中常见的偏倚及其控制》由会员分享,可在线阅读,更多相关《流行病学:研究中常见的偏倚及其控制(43页珍藏版)》请在装配图网上搜索。

1、流行病学研究流行病学研究研究中研究中常见常见的的偏倚及其控制偏倚及其控制 随机误差随机误差 即机遇、抽样误差,因随机抽样而产生的差即机遇、抽样误差,因随机抽样而产生的差 异。异。抽样研究中普遍存在,不可避免;抽样研究中普遍存在,不可避免;但可以衡量并加以控制。但可以衡量并加以控制。误误 差差误误 差差系统误差系统误差 由于设计、资料收集及分析方法不当所造由于设计、资料收集及分析方法不当所造成的差异成的差异;误差向量方向一致,不能通过增大样本量误差向量方向一致,不能通过增大样本量来克服它;来克服它;可避免且应该避免产生。可避免且应该避免产生。偏倚(偏倚(bias)含义含义 在流行病学调查研究的设

2、计、实施、分析以至推在流行病学调查研究的设计、实施、分析以至推论的各个阶段,由于某些因素的影响而使得研究结果与论的各个阶段,由于某些因素的影响而使得研究结果与真实情况之间出现的系统误差,使研究因素与疾病之间真实情况之间出现的系统误差,使研究因素与疾病之间的真实联系被歪曲,造成虚假的联系或掩盖真实的联系,的真实联系被歪曲,造成虚假的联系或掩盖真实的联系,从而导致错误结论。从而导致错误结论。偏偏 倚倚偏偏 倚倚 性质性质 系统误差、错误,可以避免产生。系统误差、错误,可以避免产生。分类分类 选择偏倚、信息偏倚和混杂偏倚。选择偏倚、信息偏倚和混杂偏倚。1 1、选择偏倚(、选择偏倚(selection

3、 biasselection bias)含义含义是指被选入的研究对象与没有被选入者特征上是指被选入的研究对象与没有被选入者特征上的差异所造成的系统误差。(由于选择研究对象的方法的差异所造成的系统误差。(由于选择研究对象的方法不恰当,导致入选对象(样本人群)与理论上符合条件不恰当,导致入选对象(样本人群)与理论上符合条件入选的对象(目标人群)间产生的系统误差)。入选的对象(目标人群)间产生的系统误差)。来源来源主要产生于研究的设计阶段,也可产生于资料主要产生于研究的设计阶段,也可产生于资料收集过程中的失访或无应答。收集过程中的失访或无应答。一、选择偏倚一、选择偏倚(selection bias)

4、定义定义 研究对象的选取过程中,由于选取方式不当,研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。由此造成的偏倚称为选择偏倚。描述性研究的选择偏倚描述性研究的选择偏倚 主要体现主要体现在样本对总体的代表性上在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。部效度(外推)受限问题。控制方法控制方法 尽量采用随机抽样,避免样本选取的

5、偏向尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等对特定群体的结果在外推上要谨慎等 分析性研究的选择偏倚分析性研究的选择偏倚 主要体现主要体现 研究对象进入、排除、不参与或失访等研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。计的偏倚。控制方法控制方法选取具体环节或已选取人群的具体特征选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关分析研究对象的选取是否同暴露或处理因素有关常见选择偏

6、倚常见选择偏倚 入院偏倚入院偏倚 失访偏倚失访偏倚 志愿者偏倚志愿者偏倚第三节 研究的偏倚选择偏倚选择偏倚 入院率偏倚入院率偏倚 也称伯克森偏倚也称伯克森偏倚。当利用医院病人作为研究对象时,病例当利用医院病人作为研究对象时,病例及对照组均不是各自总体的随机样本。及对照组均不是各自总体的随机样本。防止方法防止方法是选择人群中的病例或对照的是选择人群中的病例或对照的随机样本。随机样本。选择偏倚选择偏倚现患病例现患病例新病例偏倚新病例偏倚 也称奈曼偏倚。也称奈曼偏倚。由于仅选择现患病例,而不包括死亡病例、由于仅选择现患病例,而不包括死亡病例、已痊愈的病例及病程短的轻型病例产生的偏倚。已痊愈的病例及病

7、程短的轻型病例产生的偏倚。两类病例的暴露史可能有差异,且现患病两类病例的暴露史可能有差异,且现患病例多数病程较长,可能已经改变了原有的暴露例多数病程较长,可能已经改变了原有的暴露情况。情况。防止方法防止方法是选用新病例。是选用新病例。选择偏倚选择偏倚 检出偏倚检出偏倚 或称检出症候偏倚。或称检出症候偏倚。指由于一些与疾病无关的因素而引指由于一些与疾病无关的因素而引起疾病的某些症状,促使患者早期就诊起疾病的某些症状,促使患者早期就诊而发现疾病。如选用这部分早期病人作而发现疾病。如选用这部分早期病人作研究对象,可使研究误认为该因素是疾研究对象,可使研究误认为该因素是疾病的病因。病的病因。检出症候偏

8、倚检出症候偏倚 例子:妇女使用雌例子:妇女使用雌H子宫容易出血子宫容易出血早期就早期就医而发现子宫内膜癌,用这部分人作病例对照医而发现子宫内膜癌,用这部分人作病例对照研究时,就易造成雌研究时,就易造成雌H与子宫癌有关联的错误与子宫癌有关联的错误结论。实际上该因素只是这部分研究对象得以结论。实际上该因素只是这部分研究对象得以发现的一个诱因,而不是其病因,当用全子宫发现的一个诱因,而不是其病因,当用全子宫癌人群的随机样本时即可得出两者无关的结论。癌人群的随机样本时即可得出两者无关的结论。选择偏倚选择偏倚易感性偏倚易感性偏倚 由于某些因素影响到疾病的易感性,而由于某些因素影响到疾病的易感性,而导致研

9、究因素与疾病间的虚假联系。如健康导致研究因素与疾病间的虚假联系。如健康工人效应:工人疾病的易感性较其他人群可工人效应:工人疾病的易感性较其他人群可能更低。能更低。无应答偏倚无应答偏倚 无应答者是指研究对象中没有按照研究设计对被调查的内容予以回无应答者是指研究对象中没有按照研究设计对被调查的内容予以回答者。无应答者与应答者可能在暴露情况、患病情况、易感性等特征答者。无应答者与应答者可能在暴露情况、患病情况、易感性等特征均有不同。造成实际研究人群与总体目标人群间存在系统差异。均有不同。造成实际研究人群与总体目标人群间存在系统差异。排除偏倚排除偏倚 在研究对象的确定过程中,没有按照对等的原则或标准从

10、观察组或在研究对象的确定过程中,没有按照对等的原则或标准从观察组或对照组中排除某些研究对象。对照组中排除某些研究对象。二、信息偏倚(二、信息偏倚(Information bias)含义又称观察偏倚、测量偏倚,主要发生于含义又称观察偏倚、测量偏倚,主要发生于资料收集阶段,是由于测量暴露或结局的方法资料收集阶段,是由于测量暴露或结局的方法有问题,所获得的信息不准确而产生的系统误有问题,所获得的信息不准确而产生的系统误差。差。来源可来源于研究者、研究对象及用于测量来源可来源于研究者、研究对象及用于测量 的仪器、设备及方法。的仪器、设备及方法。分类(常见来源举例)分类(常见来源举例)无差异性错误分类和

11、差异性错误分类表无差异性错误分类差异性错误分类错误分类数据错误分类数据研究真实数据研究真实数据信息偏倚信息偏倚回忆偏倚回忆偏倚 由于研究对象对过去事件的回忆不准确所产由于研究对象对过去事件的回忆不准确所产生的系统误差。常发生于病例对照研究。(通生的系统误差。常发生于病例对照研究。(通常病例组往往表现为记忆准确性高于对照组)常病例组往往表现为记忆准确性高于对照组)报告偏倚(说谎偏倚)报告偏倚(说谎偏倚)是指由研究对象有意夸大或缩小某些信息而是指由研究对象有意夸大或缩小某些信息而导致的偏倚。如调查青少年的吸烟史。导致的偏倚。如调查青少年的吸烟史。诊断怀疑偏倚诊断怀疑偏倚 由于研究者事先知道研究对象

12、的对研究因素的暴露情况,在作由于研究者事先知道研究对象的对研究因素的暴露情况,在作 出诊断结果时容易出现带有倾向性的主观判断。(如暴露组细致检出诊断结果时容易出现带有倾向性的主观判断。(如暴露组细致检 查,对非暴露组或对照组则较粗略);另外,研究对象如知道暴露查,对非暴露组或对照组则较粗略);另外,研究对象如知道暴露 情况,也可能出现对未来结局的主观判断。情况,也可能出现对未来结局的主观判断。多见于队列研究和实验性研究中。多见于队列研究和实验性研究中。暴露怀疑偏倚暴露怀疑偏倚 研究者若事先了解研究对象的患病情况,对病例组和对照组询研究者若事先了解研究对象的患病情况,对病例组和对照组询 问的态度

13、和方法可能不同。问的态度和方法可能不同。测量偏倚测量偏倚 指由于仪器、设备不准确、检测方法不当、操作技术问题而导致指由于仪器、设备不准确、检测方法不当、操作技术问题而导致测量结果偏离真值。测量结果偏离真值。为了减少错误分类以及改善测量的准确为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标性,研究者们正在越来越多地使用生物学标记物(记物(biological markers)。它们可以用来)。它们可以用来测量易感性、内暴露(实际进入体内)剂量测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。或生物学效应(剂量)等。三、混杂偏倚(三、混杂偏倚(confoundi

14、ng biasconfounding bias)混杂因素(混杂因素(confounding factorconfounding factor)含义含义又称混杂因子或外部因素,是指可能歪曲又称混杂因子或外部因素,是指可能歪曲(掩盖或夸大)研究因素与疾病间真实联系的某(掩盖或夸大)研究因素与疾病间真实联系的某些非研究因素些非研究因素。混杂因素(混杂因素(confounding factor)基本特点(成立的条件)基本特点(成立的条件)a.与疾病有关联。与疾病有关联。b.与研究因素有关联。与研究因素有关联。c.不能是暴露的效应,尤其不能是暴露与研究不能是暴露的效应,尤其不能是暴露与研究疾病之间的中间

15、变量。疾病之间的中间变量。混杂偏倚混杂偏倚 估计研究因素与疾病间联系时,受到一个或多估计研究因素与疾病间联系时,受到一个或多个既与疾病有密切关系,又与研究因素有密切关系的个既与疾病有密切关系,又与研究因素有密切关系的潜在因素的影响,从而歪曲了(掩盖或夸大)研究因潜在因素的影响,从而歪曲了(掩盖或夸大)研究因素与疾病间的真实联系,使研究结果产生素与疾病间的真实联系,使研究结果产生 系统性偏离的情况。这种现象称为混杂,产生的偏倚系统性偏离的情况。这种现象称为混杂,产生的偏倚叫混杂偏倚。叫混杂偏倚。E E E C?F?F?D D D (1)继发关联 (2)直接因果关联的歪曲 (3)直接因果关联的歪曲

16、 图 8-4 混杂偏倚引起假关联 继发关联(继发关联(secondary association)即怀疑的病因(暴露)即怀疑的病因(暴露)E E与疾病与疾病D D并不存在因并不存在因果关系,而是由于两者(果关系,而是由于两者(E,DE,D)有共同的原因)有共同的原因C C,E,DE,D同同C C存在关联,从而继发产生存在关联,从而继发产生E E与与D D的关联。的关联。C?DE例如例如 高血清胆固醇高血清胆固醇(C)(C)是冠心病是冠心病(E)(E)的危险因素,的危险因素,高血清胆固醇可产生沉积于眼睑的黄色瘤高血清胆固醇可产生沉积于眼睑的黄色瘤(D)(D),从,从而导致黄色瘤与冠心病的继发关联

17、。而导致黄色瘤与冠心病的继发关联。例如例如 吸烟是胰腺癌的危险因素,吸烟又与喝咖啡吸烟是胰腺癌的危险因素,吸烟又与喝咖啡存在相关(没有确定的时间先后),从而造成喝咖存在相关(没有确定的时间先后),从而造成喝咖啡与胰腺癌的继发关联。啡与胰腺癌的继发关联。直接因果关联的歪曲直接因果关联的歪曲 如果怀疑病因如果怀疑病因E E与疾病与疾病D D既存在直接关联,又存在既存在直接关联,又存在间接关联间接关联(图图A)A)或与其他危险(保护)因素或与其他危险(保护)因素F F存在相关存在相关(图图B)B),暴露,暴露E E与疾病与疾病D D的直接因果关联程度或方向将的直接因果关联程度或方向将可能受到混杂干扰

18、,即得到歪曲的关联估计值可能受到混杂干扰,即得到歪曲的关联估计值。FDEFDE?AB 例如例如 静脉吸毒静脉吸毒(E)(E)与性乱与性乱(F)(F)都是都是HIVHIV感染感染D D的危险的危险因素,吸毒者易发生多性伴行为,即吸毒同因素,吸毒者易发生多性伴行为,即吸毒同HIVHIV感感染既存在直接关联(染既存在直接关联(EDED)又存在间接关联)又存在间接关联(EFDEFD),吸毒与多性伴没有确定的时间先后),吸毒与多性伴没有确定的时间先后而呈双向相关,多性伴而呈双向相关,多性伴(F)(F)将对吸毒将对吸毒E E与与HIVHIV感染感染(D)(D)的直接因果关联起混杂或歪曲作用。的直接因果关联

19、起混杂或歪曲作用。混杂的判定原则混杂的判定原则 比较混杂因素调控前后的暴露因素效应估计值,比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。如果存在有意义的差异,就产生了混杂偏倚。调控的统计方法调控的统计方法 分析阶段:标准化率、分层和多变量分析分析阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入设计阶段:配比、随机化分配或限制进入四、混杂偏倚的分层分析四、混杂偏倚的分层分析 M-HM-H(Mantel-Haenszel)分层分析方法的步骤分层分析方法的步骤 对可能的混杂因素进行分层对可能的混杂因素进行分层 判定层间判定层间RRRR或或OR

20、OR是否相等或相近是否相等或相近 得到控制混杂后的调整得到控制混杂后的调整RRRR或或OROR 再将调整再将调整RRRR或或OROR与分层前的粗与分层前的粗RRRR或粗或粗OROR(cRRcRR或或cORcOR)进行比较)进行比较 队列研究(1)累计发病率资料2221010/1iiiiiMHiiiiiia dbcTN N M MTT01/iiiMHiiia NTRRc NT表8-4(2)发病密度资料01/iiiM Hiiia NTR Rc NT2112110/iiiiMHiiiiaN MTMN NT 表8-5 病例对照研究/iiiM Hiiia dtO Rb ct2221010/1iiiiiM

21、 Hiiiiiia db ctm mn ntt (1)按可能的混杂因素吸烟分层表8-7表8-8ai bi m1i ci di m0ini n0 ti (2)(2)判定层间关联效应水平是否同质判定层间关联效应水平是否同质按是否吸烟分层后,两层内的饮酒与肺癌的关联按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质效应大小是同质(同质性检验同质性检验)的,可以应用的,可以应用M-HM-H方方法计算综合法计算综合OROR121 41.566 9OR23 361.594 17OR12OROR cRR=aRR 无混杂作用,不存在混杂偏倚。无混杂作用,不存在混杂偏倚。cRRaRR 为正混杂,高估联系强

22、度。为正混杂,高估联系强度。cRRaRR 为负混杂,即为负混杂,即cRR低估了联系强度低估了联系强度。混杂偏倚的测量混杂偏倚的测量(1)含有某可疑混杂因素时,研究因素与研究疾病的效应)含有某可疑混杂因素时,研究因素与研究疾病的效应 估计值估计值cRR或或cOR(粗粗RR或粗或粗OR)(2)按该混杂因素调整)按该混杂因素调整 后的效应值,即去除该因素产生的后的效应值,即去除该因素产生的 混杂作用后的效应值混杂作用后的效应值aRR或或aOR(调整调整RR或调整或调整OR)A.考查指标考查指标B.判定方法判定方法若值若值0,为无混杂;,为无混杂;当值当值0,为正混杂;,为正混杂;当值当值0,为负混杂

23、;,为负混杂;值的大小表示混杂的程度大小。值的大小表示混杂的程度大小。cRR-aRRaRR 混杂偏倚混杂偏倚表示混杂偏倚大小与方向的公式:表示混杂偏倚大小与方向的公式:3 3)混杂偏倚)混杂偏倚(confounding bias)偏倚分类偏倚分类1 1)选择偏倚)选择偏倚(selection bias)2 2)信息偏倚)信息偏倚(Information bias)入院率偏倚入院率偏倚(admission rate biasadmission rate bias)现患现患-新发病例偏倚新发病例偏倚(prevalence-incidence biasprevalence-incidence bia

24、s)无应答偏倚(无应答偏倚(non-respondent biasnon-respondent bias)检出征候偏倚(检出征候偏倚(detection signal biasdetection signal bias)易感性偏倚(易感性偏倚(susceptibility biassusceptibility bias)回忆偏倚回忆偏倚(recall biasrecall bias)诊断怀疑偏倚诊断怀疑偏倚(diagnostic suspicion biasdiagnostic suspicion bias)暴露怀疑偏倚(暴露怀疑偏倚(exposure suspicion biasexposu

25、re suspicion bias)报告偏倚(报告偏倚(reporting biasreporting bias)检出偏倚(检出偏倚(detection biasdetection bias)诱导偏倚(诱导偏倚(inducement biasinducement bias)五、偏倚的控制五、偏倚的控制 1 1、设计阶段、设计阶段 主要预防主要预防选择性偏倚选择性偏倚和和某些混杂偏倚某些混杂偏倚。1、设计方案的选择、设计方案的选择 控制偏倚最有效的是流行病学实验;控制偏倚最有效的是流行病学实验;其次是队列研究;其次是队列研究;病例对照研究出现偏倚机会较多,但工作容易开展,仍常病例对照研究出现偏倚

26、机会较多,但工作容易开展,仍常选用;选用;描述性流行病学由于不事先设立可比的对照组,受偏倚影描述性流行病学由于不事先设立可比的对照组,受偏倚影响最大,响最大,仅能提供分布情况和初步的病因线索。仅能提供分布情况和初步的病因线索。(2)研究对象的选择研究对象的选择 1 1)对研究对象进行限制的方法)对研究对象进行限制的方法 即针对某些可能的混杂因即针对某些可能的混杂因素,在设计时通过限制研究对象的入选条件,以达到控制素,在设计时通过限制研究对象的入选条件,以达到控制混杂偏倚的目的。混杂偏倚的目的。2 2)匹配的方法)匹配的方法 即为研究对象选择对照时,使对照组成员即为研究对象选择对照时,使对照组成

27、员在可能引起混杂偏倚的一个或多个因素上与对照组保持一在可能引起混杂偏倚的一个或多个因素上与对照组保持一致,从而消除混杂因素对研究结的影响。致,从而消除混杂因素对研究结的影响。3 3)随机化分组)随机化分组 目的是尽量保证可能的混杂因素在比较组目的是尽量保证可能的混杂因素在比较组间分布均衡,特别是分层随机分组的方法。间分布均衡,特别是分层随机分组的方法。4)4)多途径选择病例和对照多途径选择病例和对照 2 2、资料收集阶段、资料收集阶段-主要是控制主要是控制信息偏倚。信息偏倚。(1)运用正确的资料收集方法和严格的质量控制)运用正确的资料收集方法和严格的质量控制 如对实验组与对照组采用同样的调查方

28、法和调查态如对实验组与对照组采用同样的调查方法和调查态度、对所用仪器、试剂等要标准化、要培训调查员等。度、对所用仪器、试剂等要标准化、要培训调查员等。(2)采用)采用“盲法盲法”收集资料收集资料 (3)尽量采用客观指标)尽量采用客观指标(4)尽可能减少无应答和失访)尽可能减少无应答和失访 做好宣传工作、调查手段要简便易行,易被接受。做好宣传工作、调查手段要简便易行,易被接受。3 3、资料分析阶段、资料分析阶段-主要是控制主要是控制混杂偏倚。混杂偏倚。(1)标准化)标准化 选择一个标准的混杂因子构成,计算标选择一个标准的混杂因子构成,计算标 准化死亡率、标化死亡比。准化死亡率、标化死亡比。(2)分层分析)分层分析 采用采用Mantal-Hazenszelw分层分析法。分层分析法。(3)多因素分析)多因素分析 如多元相关与回归、多元如多元相关与回归、多元Logistic回归等。回归等。(4)配比分析)配比分析 配比设计的资料应按配比分析法分析。配比设计的资料应按配比分析法分析。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!