医学科研中的偏倚和交互作用

上传人:gao****ang 文档编号:188686118 上传时间:2023-02-20 格式:DOCX 页数:21 大小:52.39KB
收藏 版权申诉 举报 下载
医学科研中的偏倚和交互作用_第1页
第1页 / 共21页
医学科研中的偏倚和交互作用_第2页
第2页 / 共21页
医学科研中的偏倚和交互作用_第3页
第3页 / 共21页
资源描述:

《医学科研中的偏倚和交互作用》由会员分享,可在线阅读,更多相关《医学科研中的偏倚和交互作用(21页珍藏版)》请在装配图网上搜索。

1、医学科研中的偏倚与交互作用与控制第一节 概 念一、误差科研设计、实施及分析过程中产生的各种误差(error),可能导致研究结果不能真实地、 精确地反映实际正确的结果。误差是指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差。因此, 必须有“金标准(golden standard)或相对可靠的标准来度量真实值才能度量误差。研究结 果与真实情况的差异即为误差。误差有两类:(1)随机误差(random error), (2)系统误差 (systematic error)或称偏倚。随机误差(randomerror):广义的随机误差,泛指因机遇不同估计总体参数时所产生的 误差, 机遇既可以指

2、选择的机遇,也可以指时间的机遇。如果误差由机遇以外的原因所造成 则为非随机误差。 狭义的随机误差指随机抽样所得均值对总体均值的误差。随机误差主要是 由抽样误差引起,其中包括一些随机测量误差。 抽样误差指随机抽样所得均值对总体均值的 误差,它由总体中个体的变异引起,其大小决定于研究设计和评价指标的统计学特点。抽样 误差无一定方向,可以相互抵消, 并可通过改进抽样技术(如严格遵守随机化原则,分层抽 样,增加样本含量,重复试验以及提高抽样对象的受检率,减少失访率等)加以控制,但不 可能完全避免。因此在资料分析阶段,必须用统计学方法计算抽样误差的大小。二、偏倚偏倚是指在调查研究设计或实施阶段,由于某种

3、或某些因素的影响,使得研究或推论的 结果与真实的情况存在系统误差,或指在研究或推论过程中所获得的结果系统地偏离其真实 值,属于系统误差。 偏倚造成的结果与真值间的差异,具有方向性,它可以发生在高于真值 的方向,也可发生在低于真值的方向。偏倚是影响流行病学研究真实性的重要原因之一,由于有时难以得到判断真实性的金标 准,因此即便在很严格的流行病学研究设计之下,也很难判断是否完全避免了偏倚。尽管如 此,如果对偏倚的来源和产生原因有了深刻的认识,则有可能最大限度地减少偏倚的发生, 以便取得有价值的研究结果。误差与偏倚都是指测量结果与真值间的偏离。但它们两者之间有着本质的区别。 随机误 差是由于抽样而致

4、的变异,它无方向性,这种误差是普遍存在的。它可以设法减少但不能完 全防止(如随机化抽样,加大样本量)。偏倚是指随机误差以外的误差,是指观察到的均值与 真值之间的系统误差,这种误差不能用统计学方法处理,它是由某些较为恒定的不能准确定 量的因素造成,重复抽样或加大样本含量并不能使这种误差减少或消失,它只能依靠研究者的周密设计和科学判断来加以解决。偏倚系非抽样误差,它是错误的,必须努力防止。三、偏倚的方向 偏倚是一种系统误差,它或偏向于正方向,使原来的真值被夸大;或偏向于负方向,使 原来的真值被缩小,因此偏倚是有方向的。定量并精确地估计偏倚的程度(即偏倚的大小)有困难,而确定偏倚的方向相对比较容 易

5、。偏倚的方向指研究人员对事物所产生效应(effect)的估计值是大于或小于效应真值所做 出的一种定性判断,不涉及偏倚的大小。现假定某一欲观察或测量效应值的真实值为0,而反映在样本中的观测值M。设定凡 是夸大真实效应者为正偏倚,不论真实效应为危险效应还是保护效应,而缩小真实效应者为 负偏倚。零效值(nu 11 value )是一个统计学中的概念,是指产生零效应的值。例如,对于RR 或OR=1时即为无效值。因此,研究中的真实效应用RR(9 )表示,当RR(9)=1.0,即 为零效应;RR(9)1为危险效应,RR(9)1:9 9 1,夸大危险效应,或远离零效应值(或无效值),称为正偏倚;991,缩小

6、危险效应,趋向零效应值,称为负偏倚; 当效应值为保护(预防)效应时, RR(9 )1;991,偏倚缩小了保护效应, 9趋近零效应值,称为负偏倚;991,RR=2.0,是危险效应;当RR =4.0时,它远离零效应值,夸大了原危险效应,RR被判为正偏倚;RR =1.5时, 它趋近零效应值,缩小了原危险效应,RR被判为负偏倚。 RR(9)1或9 aRR (f),为正混杂(positive confounding),亦称阳性混杂,即由于混杂因素(f)的混杂作用,使cRR高估了研究因素与研究疾病之间的联系(指暴露因素为疾病的病因 或危险因素时)。 若cRRvaRR (f),为负混杂(negative c

7、onfounding),亦称阴性混杂,即由于混杂因素(f)的混杂作用,使cRR低估了研究因素与研究疾病之间的联系(指暴露因素为疾病的病因 或危险因素时)。混杂偏倚及其方向与程度也可如下测量:混杂偏倚=cRRaRR (f) /aRR (f)若值=0,为无混杂。当值H0,若为正值,为正 混杂,高估了关联强度;若为负值,为负混杂,低估了关联强度;值的大小为混杂的程度。(3)利用分层分析进行定量判别:所谓分层分析是将研究对象按是否暴露于提出的可疑 混杂因素(f)分类(最简单可分为暴露组与非暴露两组)。按可疑混杂因素分层后的研究因 素与研究疾病的效应估计值称为调整掉混杂作用的效应估计值,用aRR】(f)

8、和aRR2 (f)来 描述。如果其他病因因素和危险因素在两比较组研究对象中的分布完全均衡,同时可疑混杂 因素和研究因素之间在产生研究疾病时不存在交互作用,则aRR2 (f)和aRR (f)应完全相 等。现以效应估计值RR为例(OR同),测量方法如下: 若cRR=aRR2 (f)或aRR (f),则无混杂作用,cRR不存在混杂偏倚。 若cRRHaRR2 (f)或aRR (f),则有混杂作用,cRR存在混杂偏倚。上述测量也可转变为混杂指数RFi (index of the degree of confounding)来判别: RF.=cRR/aRR. (f),式中:RF.为混杂指数,i表示分层后的

9、某一层。iii 若RF.=1,则无混杂作用,cRR不存在混杂偏倚。 若RFjHl,则有混杂作用,cRR存在混杂偏倚。二、 偏倚的控制偏倚一旦发生就会导致研究结果与真实情况存在系统差异,甚至会得出完全错误的结 论。因此,在进行研究设计时应深入了解、认识各类偏倚,以便在研究过程中尽量加以避免 或控制,从而保证研究结果的真实性。(一)设计阶段1.强调严格的科研设计 多数偏倚发生于科研的设计阶段,研究者应充分了解,掌握该 项研究工作中各种可能的偏倚来源及其发生情况,以便在具体设计过程中尽量予以避免。在 设计阶段,偏倚可来源于选择研究对象或对照的不妥,如抽样方法不正确,诊断标准、排除 标准、纳入标准不统

10、一,样本大小不适当,各比较组间缺乏可比性等。例如一项有关两种药 物治疗银屑病病人的试验,研究因素为两种药物,非处理因素可能有年龄、性别等,不同年 龄,性别间治疗效果可能不一样,设计时应针对这些非处理因素,设法使之在各比较组间分 布均衡,从而消除其对治疗效应的影响。偏倚也可来源于决定调查方法和资料收集方法时考 虑不同,如调查表设计不好,实验室检测缺乏质控,判断结果缺乏客观指标等。例如在进行 磷敷贴与神经性皮炎的关系研究时,发现社会经济地位可能是一潜在混杂因素,并可导致选 择偏倚的产生,则设计中规定采取准确记录研究对象的社会经济地位,在分析过程中对该因 素影响进行校正,而达到部分控制选择偏倚的目的

11、。在病例对照研究中,理想的研究对象应 是社区人群中的全体病例和非该病病例及正常人,或其有代表性的样本,但往往很难做到。 虽然在医院选择研究对象易产生入院率偏倚,但对临床科研工作者来说由于方便、易行、应 答率高等优点,在实际工作中常被采用。此时最好选用两个或两个以上的对照组,如不同病 种对照,其中之一最好取自社区一般人群。如此通过比较不同对照组的结果,可对是否存在 选择偏倚作出判断。在队列研究中,条件许可时,最好也应设立多种对照,如对暴露队列既 应用内对照又设立比较队列(外对照),或用全人群资料作比较,从而减少选择偏倚对结果的 影响。偏倚一旦发生,则一般很难在资料分析阶段加以消除,唯一的方法就是

12、要求研究者进 行严格的科研设计来预防这些偏倚的发生。2限制(restriction) 即对各比较组研究对象的条件加以某种限制。从理论上讲,两 组进行比较,除研究因素外,其他因素(非研究因素,非处理因素)应当均相同,这样两组 的均衡性好,才能比较研究因素在两组中是否有差异,但临床情况千变万化,事实上是做不 到的。例如同一种疾病(如银屑病)发生在不同个体身上,病型、病情、病期及预后都可能 不同。因此可在选择研究对象时,针对某一或某些可能的混杂因素,在设计时对研究对象的 入选条件予以限制。例如研究吸烟与冠心病的关系时,考虑年龄与性别可能均为潜在的混杂 因素,可规定研究对象仅限于某社区内4050 岁的

13、男性居民。在研究口服避孕药与心肌梗死 的关系时,考虑到年龄是可能的混杂因素,即仅对3544 岁年龄组的妇女做调查。另外,例 如患胃肠道疾病者,不宜选作评价口服药物疗效的对象,因为可能影响药物的吸收。参加疗 效评价的患者也不宜同时患其他严重疾病,这是因为这些患者在研究过程中可能死亡或因病 情加重被迫退出,这些在设计时都应限制。值得注意的是对研究对象针对潜在的混杂因素实 行限制后,可得到同质的研究对象(homogeneous objective),从而防止某些混杂偏倚,有利 于对研究因素与疾病之间的关系作出较为准确的估计。但是在这种情况下,研究工作就丧失 了概括性,即从研究对象中排除某些人群后,所

14、选择的病例不能代表患者总体,对照也不代 表一般人群,因而所获得的结论常具有很大局限性,影响研究对象对总体的代表性,使研究 结果外推至一般人群时的外推真实性(external validity)受限。另外有一点要交待:采用限制 的方法控制混杂因素,一方面只能针对特别重要的混杂因素,先决条件为限制后仍然能保证 适当的样本数。另一方面,限制的结果使得研究者不可能对暴露和混杂两因素的交互作用加 以分析和度量,只能确保对暴露与疾病之间关系的研究。限制的缺点还在于,在限制混杂因 素的同时,对暴露和疾病发生的范围也做了限制,难于观察到暴露因素对研究疾病影响的全 貌,因此,作结论时应该慎重。3匹配(match

15、ing) 匹配是指在为指示研究对象选择对照时,为病例组的每一个研究 对象匹配一个或几个具有同样特征的对照,然后进行比较;也即使其针对一个或多个潜在的 混杂因素(即匹配因素)与指示研究对象相同或接近,从而消除混杂因素对研究结果的影响 匹配在非实验性和实验性研究中均可应用。许多研究者常以年龄、性别、种族、职业、经济 收入等人口统计学特征作为匹配条件,因为这些因素可能是最常见的混杂因素。根据具体疾 病及研究因素,许多其他因素也可作为匹配条件,如疾病病型、病期、病情程度及先前的治 疗等。匹配条件越多,寻找对照就越困难。但有一点必须强调,不能将研究因素作为匹配条 件,否则就不能观察该研究因素在比较组间有

16、何差异,这种情况称匹配过度(over-matching), 应注意避免,因此,匹配因素不宜太多,一般认为,以只列入主要的混杂因素为宜。匹配可分为成组匹配和个体匹配。成组匹配(category matching),又称频数匹配(frequency matching),是指为一组研究对象配上一个潜在混杂因素频率相似的对照组。成组匹配可看成 分层抽样的变种,即先按某些特征将总体分层后,再从各亚层中随机抽取病例,然后按病例 在各层的分布比例抽取对照样本。例如若抽得的病例样本中男、女各半,75 岁以上者占2/5, 则对照组中也应如此。个体匹配(individual matching)是为每一位研究对象根

17、据需要控制的 混杂因素配上一个或多个对照。其中1 : 1匹配又称配对(pair matching), 1 : 2, 1 : 3, 1 : R (或1 : M)匹配时,则称为匹配。一般不应超过1 : 4。配比的目的是使某些潜在的混杂因 素,在各个比较组间有相同或类似的分布,以达到消除混杂因素的目的。另外,匹配时配对 变量的单位不应太粗,如年龄配对时应限制在上下23岁左右,不应粗到上下10岁的差别, 这样便失去限制的作用。匹配的变量应当一致到什么程度,取决于变量的性质、实际可能与 必要,离散型变量(如性别)可以完全匹配。一般除年龄、性别之外,对于其他因素是否引 入匹配须持慎重态度,以防止匹配过度及

18、徒增难度和费用。4.随机化(randomization)指按随机化原则使研究对象都有等同的概率(同等的机会) 被分配到各处理组中,从而使潜在的混杂因素,可测量或不可测量及无法预知的非处理因素 (非研究因素)在各组间分布均衡。随机化方法常用于实验性研究,以在临床试验中最常用 随机化方法进行分组是消除选择性偏倚最好的方法,它不仅平衡掉治疗组和对照组的各种可 能影响疗效或预后的因素,而且也平衡了各种未知的可能影响疗效和预后的因素。随机化分 组后可以发现两组的一些基本特征极为相似,表明各比较组间除了研究因素外,其他非研究 因素在各组间分布均衡,因此可比性好。随机分配方法可分为简单随机分组( simpl

19、e randomization)和分层随机分组(stratified randomization)。前者指按照随机分配原则,利用 随机化方法直接将研究对象分配在各组中。这种方法适合于对混杂因素不太了解时应用。后 者是根据拟控制的混杂因素(如按年龄、性别、病情、病程等)先将研究对象分层,然后再 将每一层的研究对象随机分配在各组之中。这种方法适合于对主要混杂因素充分了解时应用。 如在一项有关不同药物治疗银屑病的疗效临床试验中,病型为混杂因素,可先将研究对象按 不同病型分层,然后再将各层研究对象随机分配到实验组和对照组。(二) 实施阶段 在对结果的观察、测量及收集过程中,偏倚既可以来自研究对象,又可

20、来自研究者本人1.盲法(blinding或 masking) 可分为单盲(single blinding),双盲(double blinding) 和三盲(triple blinding)o单盲指只有研究者了解研究对象的分组情况而研究对象不知道自 己是在试验组还是在对照组。其优点是研究者可以更好地观察了解研究对象,可避免来自研 究对象方面的偏倚。缺点是避免不了研究者方面带来的主观偏倚,易造成对试验组和对照组 的处理不均衡。双盲指研究者和研究对象都不了解试验分组情况,而是由研究设计者来安排 和控制全部试验,由于双盲使调查者和研究对象对分组情况及有关内容均不知晓,因而可以 避免诊断怀疑偏倚、暴露怀

21、疑偏倚或报告偏倚等。如此在调查过程中虽然仍有可能发生信息 偏倚,导致错误分类,但由于对比组间资料的准确度相似,即使发生错误分类,属于无差异 错误分类的可能性较大,可据此对研究结果外推的可靠性作出相应的估计。三盲指不但研究 者和研究对象不了解分组情况,而且负责资料收集和分析的人员也不了解分组情况,从而较 好地避免了偏倚。其优缺点基本同双盲,但实施起来很困难。盲法是避免观察者和观察对象发生偏倚的最有效方法,也是消除信息偏倚的有效手段。 在进行调查研究时,最好由同一个人对病例组和对照组进行询问调查,询问方式和时间均相 同,最好对调查者保密,不让他们知道真正的科研假设。在考核疗效时要实行双盲,考核疗

22、效者和受试者都不知道真实的治疗内容 ,而且在实验室进行各种检查的报告者也不知道谁是 观察组,谁是对照组。但是盲法的应用亦有一定的限制,当药物具有特定的气味、颜色或某 种显著的副作用;当某种诊疗程序会产生特殊的标记,如放射治疗的皮肤损害、外科手术的 疤痕、化疗引起的脱发,这些将导致无法使用盲法观察实验结局。2进行质控(quality control)培训 收集资料和测量指标阶段,对所有技术,包括 调查员、实验操作人员和试剂等都要进行质量控制。对调查员要进行统一培训,使其充分了 解调查项目的内容或含义,统一标准,统一方法,统一调查技巧。对研究对象要作好宣传、 组织工作,以便取得研究对象的密切合作,

23、使其能如实、客观的提供拟收集的信息。对研究 中使用的仪器、设备事先应予标定,试剂、试药事先测定以确定是否符合要求。例如在以询 问方式收集信息时,如对敏感问题的调查等,某些情况下报告偏倚很难避免,此时可通过调 查知情人或采取相应的调查技术以获取正确的信息。对于暴露经历发生久远的调查可通过一 定的调查技巧加以避免,如可选择一个与暴露史有鲜明联系的记忆目标帮助其联想回忆等等。(三)分析阶段 有些偏倚在设计、实施阶段没有很好的注意避免,但在分析阶段可借助一定的统计学方 法加以识别和纠正或消除。例如混杂偏倚在资料分析阶段也可以通过一定的统计处理方法予 以控制。1分层分析(stra tifica tio

24、n analysis) 分层是指将科研资料按某些影响因素分成 数层(亚组)进行分析。分层是最常用的检出和控制混杂偏倚的方法之一,也是分析阶段控 制偏倚的常用手段,特别适用于在设计阶段考虑不周或实施阶段执行不力,但尚有一定资料 可寻的可疑混杂因素作分层分析处理。可以将研究资料按照混杂因素分层, 可用 Mantel-Haenszel 分层分析方法进行分析,得到将混杂因素调整后的效应估计值。例如比较两 医院30年内胆道手术的病死率,甲医院共做1 200 例,死亡48例,病死率为4.0%。乙医院 同期共作2 400例,死亡64例,病死率为2.6%。如粗略比较似乎乙医院病死率较低,经按病 情轻重程度分层

25、分析后,结果两医院胆道手术后不同病情的病死率均相同。2.标准化(standardization) 标准化的方法可以看成是对分层分析方法的补充手段。 用于两个(或多个)样本(或总体)的指标进行比较时,排除由于内部构成不同对指标可比 性的干扰。当不同暴露水平组间混杂因素分布不均匀时,可以选择一种标准构成,来调整原 来分布的不均匀性。标化的实质在于考虑某因素分层后的权重,由此推论,OR MH也可以认为 是标化后的计算结果。率的标化分直接标化和间接标化两种方式。当比较两个率时,如果两 组对象内部构成存在差别足以影响结论,可用率的标准化加以校正,亦即使可能影响结果的 因素受到同等的加权,则这两个率可比且

26、无偏倚,这种方法称为标准化法(或调正。)例如以 粗死亡率标化为例,其标准化的原理是利用某一指定的标准人口构成,消除不同地区在人口 构成指标(如年龄、性别等)方面的差别,即计算按标准人口构成校正之后的总率,此率称 为标准化率。率的标化有两种方法:直接法direct method)是利用标准人口年龄构成和实 际年龄别死亡率计算求得死亡率。标准人口应选择有代表性、较稳定、数量较大的人群,例 如以世界、全国、全省或本地区的人口为标准人口,时间最好与被标化资料一致或接近。 间接法(indirect method)指以全国或省市各年龄组的死亡率为标准,按下述公式计算间接调 整死亡率。间接调整死亡*=rXR

27、/Z (PiXRi) 工pi式中r为各对比组的粗死亡率,Ri为各年龄组的标准死亡率,R为总标准死亡率,pi为 对比各组的分年龄段人口数。常用的标准化指标有标准化率、标准化死亡比SMR)、标准化 死亡比例比、标准化相对危险度(SRR)。3.多因素分析法(multifactorial analysis) 当样本数量不够大,分层分析常不适 用,因为应用分层分组的Mantel-Haenszel方法只能平衡少数混杂因素的作用,且对连续性变 量只能用等级分层法,常引起不合理的分组,或者希望研究多种因素(包括暴露因素和各种 混杂因素)对研究疾病的综合影响时,可考虑应用多因素分析的方法。在多因素分析时,研 究

28、因素和每个混杂因素,都被放在同等地位做分析。常用的多元分析法有:多元协方差分析 logistic回归模型,Cox比例风险模型和对数线性模型(loglinear models)等。(1) 多元协方差分析:多用于一些例数不多的观察或实验研究资料的处理。它是通过回 归的方法剔除混杂变量的效应,以保证在非处理因素水平相同的情况下用方差分析的方法比 较几种处理因素的效应。(2) 多元回归分析:传统的单因素分析方法,在揭示暴露因素与疾病之间关系时,仅能 分析单个暴露变量对疾病作用和控制单个的外部变量,而在现代流行病学研究中,尤其是在 慢性疾病的病因学研究中,常常涉及到多种致病因素间相互联系,相互制约的复杂链条,对 于多因素复合病因中各因素之间的相互联系、相互制约及因素间的联合作用的分析,单因素 分析方法显然无能为力。而在设计阶段对研究对象进行限制和匹配的方法仅能控制数量很少 的混杂变量, 例如匹配

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!