医学科研中常见统计学错误(朱继民)

上传人:1666****666 文档编号:36805467 上传时间:2021-11-01 格式:DOC 页数:36 大小:751KB
收藏 版权申诉 举报 下载
医学科研中常见统计学错误(朱继民)_第1页
第1页 / 共36页
医学科研中常见统计学错误(朱继民)_第2页
第2页 / 共36页
医学科研中常见统计学错误(朱继民)_第3页
第3页 / 共36页
资源描述:

《医学科研中常见统计学错误(朱继民)》由会员分享,可在线阅读,更多相关《医学科研中常见统计学错误(朱继民)(36页珍藏版)》请在装配图网上搜索。

1、第十五章 医学科研中常见的统计学错误第一节 科研设计中的常见错误一、抽样设计二、实验设计中的随机原则三、实验设计中的对照原则四、实验设计中的重复原则五、实验设计中的均衡原则第二节 科研数据描述中的常见错误一、统计指标的选取二、统计图表第三节 医学科研统计推断中的错误一、t检验二、方差分析三、卡方(c2)检验四、相关与回归分析五、结论表达不当第十五章 医学科研中常见的统计学错误医学科研中,研究者关心的研究对象的特征往往具有变异性;如年龄、性别皆相同的人其身高不尽相同、体重、血型等也都存在类似的现象。同时,由于研究对象往往很多,或者不知到底有多少,或者研究对象不宜全部拿来做研究;所以人们往往借助抽

2、样研究,即从总体中抽取部分个体组成样本,依据对样本的研究结果推断总体的情况。恰恰是这种变异的存在,以及如何用样本准确推断总体的需求,使得统计学有了用武之地和发展的机遇。诚然,合理恰当地选用统计学方法,有助于人们发现变异背后隐藏的真面目,即一般规律。但是,如果采用的统计学方法不当,不但找不到真正的规律,反而可能得出错误的结论,进而影响研究的科学性,甚至会使错误的结论蔓延,造成不良影响。作为医学工作者,尤其是科研工作者,必须了解当前医学科研中常见的统计学错误,以便更好地开展科研和利用科研成果。本章借助科研中统计学误用实例,介绍常见的错用情况,以帮助读者避免类似错误的发生。第一节 科研设计中的常见错

3、误统计学是一门重要的方法学,是一门研究数据的收集、整理和分析,从而发现变幻莫测的表面现象之后隐含的一般规律的科学。医学科研是研究医学现象中隐含规律的科学,包括基础医学研究、临床医学研究和预防医学研究等,不管哪类医学科研都离不开统计学的支持。要想做好医学科研,必须掌握一定的统计学知识,如总体与样本、小概率原理、资料的类型和分布、科研设计类型、统计分析的主要工作、常用统计方法以及方法的种类和应用条件等,尤其要了解当前医学科研中常见的统计学错误。实验设计原则的正确把握、统计指标和统计方法的正确选用、对假设检验结果的正确理解、弄清不同设计类型的应用场合、弄清统计结论与实际意义的真正关系等,是科学合理应

4、用医学统计学知识做科学研究的基本前提。但实际医学科研中,却存在着这样或那样的诸多统计学错误,如实验设计时违背实验设计应遵循的基本原则、进行资料描述时不能选择适当的统计指标、采用的统计图表不规范、假设检验时不顾资料与设计的类型而随意套用某种假设检验方法、不能正确理解P值与差异大小的关系、错误地将统计学结论与医学实际意义混为一团,等等。一、抽样设计抽样研究是常用的医学科研方法之一,但科研设计中常存在着抽样假随机,随意规定样本量的问题;从而破坏了抽样研究应满足的必要前提。常用抽样方法有:单纯随机抽样、系统抽样、整群抽样、分层抽样和多级抽样。二、实验设计中的随机原则随机指的是在选取样本时,应确保总体中

5、任何一个个体都有同等的机会被抽到而进入样本;在分配样本时,应确保样本中任何一个个体都有同等的机会被分入任何一个组中去。遵循随机的原则,目的就是使样本具有极好的代表性,使各组受试对象在重要的非实验因素方面具有很高的均衡性,从而提高实验资料的可比性;常见的错误是以随意代替随机。(一) 误用实例例1 有些临床医生常常根据患者来院就诊的先后顺序对他们进行分组,如将先来的10例患者作为对照组,中间来的10例患者作为A药组,后来的10例患者作为B药组。分析:这种分组方法看起来似乎很合理,其实这样分组是违反随机原则的。这样分入各组的患者可能在病情等某些重要的非处理因素上相差很多;因为在某一段时间内人们可能容

6、易患上某病,其中有一部分人看医生的态度比较积极,稍有不良感觉就会去看医生,但也有一部分人在这方面较为迟钝,病不重到一定的程度都不去看医生。换言之,在某一段时间内,患者来医院的先后顺序中,可能暗含着病情轻重不等的因素;按就诊的先后顺序分组的结果,就很可能造成某些组内重症者居多,而另一些组内轻症者居多的状况。这种违反随机原则的设计,没能很好地降低重要的非实验因素对观测结果的影响,结果的可靠性必然要受到影响。例2 原文题目:小剂量干扰素加三氮唑核苷治疗流行性乙型脑炎99例分析。原作者在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎99例,采用同期的、接受一般治疗的73例该病患者作为对

7、照。治疗组和对照组的病情,即轻型、普通型、重型和极重型的分布经c2检验差异无统计学意义。两组患者均采用传统降温、镇静、降颅内压、肾上腺皮质激素及抗生素预防感染等对症治疗;在此基础上治疗组选择发病在5天以内的患者,加用干扰素和三氮唑核苷静滴,疗程57天。两组比较疗效差异有统计学意义,结论:在一般治疗的基础上加用小剂量干扰素和三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗的效果。分析:这个研究结果似乎是合理的,因为原作者考虑到了病情严重程度这一重要的非处理因素两组的分布情况,经c2检验差异无统计学意义。其实,除了病情严重程度,这个研究中还设计到一个重要的非研究因素,即治疗的及时性。对于治疗组,要求

8、发病到治疗的时间在5天之内;而对照组却没有这样的限制;根据常识,早期治疗对疾病的预后具有重要影响,通常有较高的治愈率和较低的死亡率。所以,在治疗的及时性方面,两组不具可比性;这样得到的结论当然要受到质疑。其实,在制定实验设计方案时,应将所有重要、可控的非处理因素考虑在内;本研究除了病情严重程度外,治疗及时性也是一个重要的非处理因素,应采用随机化方法使各组患者在病情和治疗及时性上尽量达到均衡一致,从而提高组间的可比性。三、实验设计中的对照原则设立对照组的目的是寻找一个参照物,或对比的基础;因为好与坏、高与矮、快与慢、长与短等都是相对而言的。一种药物的疗效如何,要看与谁比较,是与安慰剂,还是与当前

9、市面上治疗此类疾病疗效最好的某种药物;比较的对象不同,结论是不同的。常见的错误是:缺乏对照、对照设置不当。(一) 误用实例1. 缺乏对照例1 原文题目:银屑病发病与血型的关系探讨。原作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没有进行统计分析,就认为银屑病的发病与血型有明显的关系;同时也证实了遗传致病的决定意义。分析:该文没有对照,也没有统计分析,仅凭64例病人的血型分布,就下银屑病的发病与血型有关,显然是不妥的。因为,根据常识,正常人群中的血型构成本来就不是非常均衡的;再者,64名患者的血型构成是否与发病有关,必须经与对照组进行比较,并得到

10、统计学假设检验的支持。如果正常人群的血型分布与银屑病患者的血型分布情况,经检验差异存在统计学意义,则认为血型构成可能与银屑病的发病有关,如果差异无统计学意义,则可以认为银屑病发病与血型构成无关。例2 原文题目:静脉应用维拉帕米治疗快速型心房颤动的临床观察。原作者选择快速型房颤38例(阵发性房颤8例,持续性房颤30例),其中男22例,女16例,年龄2478岁,平均52.9,心室率128179次/分,房颤持续时间2天至11年。基础心脏病分别为:风湿性心脏病11例、冠心病10例、高血压性心脏病5例、肺心病2例、扩张性心肌病2例、甲亢性心脏病2例、先天性心脏病(房间隔缺损)2例、特发性心脏病4例。心功

11、能(NYHA)分级:级11例、级13例、级14例,无级和/或预激综合征者。用药方法:常规心电监护,维拉帕米注射液5ml加入5葡萄糖10ml中,于5分钟内注射完毕;如果15分钟后心室率减慢不显著,再予以维拉帕米2.55.0静注。观察用药后5、10、15、20、30分钟的心室率及血压变化。疗效判定标准:显效:用药后心室率减慢30或心室率低于100次/分,有效:用药后心室率减慢2030但心室率不低于100次/分,无效:用药后心室率减慢20且心室率不低于100次/分。结果:至30分钟显效27例、有效11例,总有效率达100;说明该法控制房颤之心室率起效迅速、效果可靠。分析:不知您看了这个案例,有何感觉

12、?我觉得很乱、结论的可靠性难以保证。为什么呢?我们知道,要考察某种药物的疗效如何,首先必须设立合理的对照组,因为有比较才有鉴别;而本试验未安排对照组。本试验如能设置一可比的对照,严格控制重要的非实验因素,使其在各组间达到均衡一致,给对照以常规的治疗,如洋地黄制剂;这样做出的结果才能较好地反映出实验效应的差别。另外,对于不同心脏病引起的房颤,放在一起研究,似乎不太妥当;因为这样的同质性不理想。如果能适当增加各组样本数量,分开进行比较研究,效果会好许多。2. 对照不当例1 原文题目:肝炎灵联合丹参注射液治疗慢性乙型肝炎60例。原作者将慢性乙型肝炎患者随机分为两组,治疗组60例,接受肝炎灵和丹参注射

13、液联合治疗,对照组44例,接受肌苷、维生素C的治疗;两组在性别、年龄、病程、病情等方面差异均无统计学意义。比较两组肝功能指标恢复正常率,得出结论:两药联合应用治疗慢性乙型肝炎有良好的协同作用。分析:这个研究,如果想得出两药联合应用治疗慢性乙型肝炎是否有协同作用,恐怕要考虑采用析因设计为好;而从药物作用上看,丹参注射液单独应用对慢性乙型肝炎是否没有治疗作用。所以,原作者研究的真正目的可能是将肝炎灵与丹参注射液联合应用治疗慢性乙型肝炎的效果是否比单独使用肝炎灵治疗的效果好。如果是这个目的,该研究的对照就有问题了;因为原文中设置的对照无法显示两药合用是否会比单独用肝炎灵的疗效好的结论。正确的做法是,

14、对照组给予肝炎灵加安慰剂治疗,安慰剂在剂型、外观、剂量等方面与丹参注射液相同。采用双盲的方法进行分组和处理,会很好地消除主观偏性,得到的结果会更为准确可靠。例2 某人在研究药物治疗铅中毒时的驱铅效果时,设计了如下试验,见表15-1。对收集的实验资料进行统计分析后,原作者得出的结论为:此药有明显的驱铅作用。分析:本研究虽然设有对照,但原作者没有考虑到这种貌似合理的对照,实际上是很不适当的;因为治疗前后患者所处的环境也发生了变化,即脱离现场,而脱离现场前后本身,也会引起尿铅和血铅的变化。所以,虽然统计分析结果清楚地显示两组之间的差别具有统计学意义,但这并不能有效说明此药具有驱铅作用。如果要考察某种

15、疗法的驱铅效果,必需设有不给予任何治疗的空白对照;当然,这显然是行不通的,因为这样违背了伦理道德的要求;我们可以尝试做动物实验。而如果患者都必须要接受某种治疗,那么就须采用2种和2种以上的药物。采用具有一个重复测量的两因素设计定量资料的方差分析,或者把治疗前的数据作为协变量的值,采用单因素多水平设计资料的协方差分析。表15-1 30名铅中毒工人脱离现场后住院治疗的结果(s)观测指标治疗前治疗后血铅(mg/L)0.1810.0290.0730.019*尿铅(mg/L)0.1160.0090.0870.010*注:与 治疗前比,* P 0.01例3 原文题目:高血压病患者肾脏早期损害指标的探讨。原

16、作者探讨高血压患者早期肾脏损害的诊断方法,研究对象为74例高血压患者,男性43例,女性31例,平均年龄61岁(4073岁);对照组为53名体检健康的职工。分析:这个研究设计虽然有对照组,但没有介绍对照组与试验组间的可比性情况。显然,年龄和性别等重要的非试验因素可能会对研究结果带来一定程度的影响;本试验在设计时,就应将年龄和性别等作为选取对照的重要影响因素。四、实验设计中的重复原则实验设计中重复原则指的是“重复实验”,即在相同的实验条件下,做两次或两次以上的独立实验;这里的“独立”,是指要用不同的受试对象(个体或样品)做实验,而不是在同一受试对象上做多次实验。重复原则的作用在于它有利于使随机变量

17、的统计规律性充分地显露出来。常见的错误是把重复测量当作重复实验、样本量不足。(一) 误用实例例1 某人为了说明两台仪器测定结果之间的差别没有统计学意义,选择一名健康者作为受试对象。先用A、B两台仪器分别对该名受试者进行4次重复测量,1个月后,再用A、B两台仪器分别对该名受试者进行4次重复测量;测量的指标有3个,其中一个是“二尖瓣前叶EC幅度”,每一个指标共获得16个数据。然后采用方差分析和t检验进行统计学处理,得出两台仪器测定的结果之间差异无统计学意义;认为自制的廉价仪器可取代进口的昂贵仪器。分析:用同一台仪器在同一时间对同一个体进行重复测定,这实际上是“重复取样”,数据的波动反映了测定值技术

18、熟练程度的高低。1个月前后采用同样的方法对同一个人进行两次测定,这是“重复测量”,目的往往是考察受试者接受某种处理后,随着时间的推移,受试者体内某些指标的动态变化趋势;本例受试者未接受任何处理,前后的变化仅仅反映了指标的生理变化,没有实际意义。本例中,虽然每个指标均有16个原始测定值,但真正的样本大小,及独立受试对象的个数应该是1,而非16。本例严重违反了实验设计的“重复原则”。例2 为探讨不合格采样及送检导致生化指标波动的原因,原作者分析了化验室检测结果波动的4个因素。第一个因素:葡萄糖盐水输液,同侧采血和异侧(正常)采血的生化检测结果差异,用病房病人2次结果比较;结果显示:同测采血时,对肌

19、酐、尿酸等7项指标具有30200的波动,其中血糖和氯的波动尤为明显。第二个因素:样本溶血和正常标本生化指标的差异,用病房病人2次结果比较;结果显示:样本溶血时,其中19项生化检测项目均有波动。第三个因素:时间依赖性项目在抽血后3种不同时间送检引起结果的差异,用1个病人的血样说明血氨在不同时间送检结果不同。第四个因素:抽血管错误,应该用血清管,但用了枸橼酸纳抗凝管后,造成生化结果波动;用5例病人两种不同抽血管的化验结果的变化率来说明差异。分析:本例原作者对4个因素分别进行的分析,除最后一个因素用了5例受试对象外,其他三个似乎只用了1个受试对象(前两个因素中关于受试对象的描述很模糊,不知到底是1位

20、受试对象的两次检测结果还是两个病人的检测结果);由于变异性的存在,这样的结果很难有说服力,且第四个因素虽有5例,但未对数据进行统计学处理,结论的可靠性是受怀疑的。五、实验设计中的均衡原则均衡原则是实验设计四个基本原则中最核心的内容,起着统观全局的作用。所谓均衡,是指某因素各水平组中的受试对象所受到的非实验因素的影响是完全平衡的,即这些组间的差别完全是由于该因素采取了不同水平所致,而并非其他因素取值不同所造成的影响。常见错误是设计不当,难以满足均衡的要求。(一) 误用实例例1 某研究者为观察联合用药治疗鼠早期矽肺的效果,采用如下方法:石英粉尘20mg/只建立模型,采用低剂量不同抗矽肺药物分别治疗

21、60天和150天后宰杀。给药组分别为克矽平、汉防己甲素、羟基磷酸哌嗪、柠檬酸铝单一用药组,克矽平汉防己甲素、汉防己甲素羟基磷酸哌嗪、羟基磷酸哌嗪柠檬酸铝联合用药组。另有生理盐水对照组和石英阳性对照组。分别称量大鼠全肺湿重、干重,测定大鼠全肺胶原蛋白。按单因素k水平设计资料进行方差分析,差异有显著意义;进一步用q检验进行两两比较。无论是预防性治疗60天或是150天,均以“柠铝羟哌”和“汉甲素羟哌”的疗效最好,明显优于单一给药组的疗效,“克矽平汉甲素”组在150天治疗时也优于单一给药组。分析:类似的设计似乎比较常见,尤其多见于中医药的研究;其实这样的设计属于“对照不全”,因为很多组之间在某些方面是

22、不可比的,其本质则是违反了实验设计的“均衡原则”。原作者设计本实验的目的是想考察联合用药能否增加疗效,按单因素k水平设计资料进行方差分析;这样显然是不妥的。由于各组中并不全是单因素的每个水平,联合用药组涉及到多个因素不同水平的组合;即使在所设计的组中某个联合用药组的疗效好于其他组,但由于对照不全,研究之外的联合用药组疗效是否会更好,则不得而知。仔细分析可以发现,该研究涉及到5个实验因素,即克矽平用否、汉甲素用否、羟哌用否、柠铝用否及疗程,每个因素2个水平;所以采用5个因素的析因设计较为合适,这样既能分析出每个因素的实验效应,又能分析任意几个因素之间的交互作用。如此设计与原设计相比,能较为精确地

23、估计和控制误差,结果更可靠;而且,所需的动物数较少。例2 某人为研究耐力训练与提高战士体质的关系时,进行如下设计:从某连队选取20名战士构成试验组,按训练方案进行耐力训练;以机关同龄的20名战士组成对照组,只进行日常活动。观察经4周试验后,两组展示进行一定量的运动时血乳酸的变化。得出的结论:按此方案进行训练能降低运动时血乳酸的蓄积,提高战士的耐力。分析:首先,根据这样的设计得出如此结论是不妥当的;因为该实验设计违反了均衡原则,对照组的选择不合理。对照组除训练因素外,其他应尽可能与实验组一致,而机关战士和连队战士由于工作性质的不同,体能的基础可能存在较大的差别,所以研究开始时两组间就不具备可比性

24、。另外,研究回答的问题缺乏实际意义,因为人们早就知道训练和不训练不一样。可以研究不同训练方案对提高战士体质之间的差异有无统计学意义,以探索最大限度地提高战士体质的最佳方案。第二节 科研数据描述中的常见错误统计描述是统计分析的重要工作之一,是展示数据特征的必要步骤。通常依据资料的性质和类型,选择适宜的统计指标以反映数据的集中水平和变异程度;多数时候还借助统计表、统计图来展示数据的分布情况。正确选择统计指标、合理运用统计图表,是进行恰当统计描述的前提;但实际运用中,统计指标选取不当,统计图表使用不规范的现象却较为普遍。一、统计指标的选取(一) 定量资料的统计指标 1. 选择统计指标的一般方法:对于

25、定量资料,在确定统计指标前,须先考察资料的分布特征,看其是否满足正态分布的要求;从而为选用恰当的统计指标提供参考。如果资料满足正态性,则考虑采用算术均数和标准差,即以s表示样本数据的集中水平和离散程度;如果数据经对数变换后能满足正态性的要求(如等比资料),则采用几何均数(G)描述其集中水平;如资料分布不能满足正态性(如传染病的潜伏期),通常采取中位数(M)和四分位数间距(Q)作为描述其集中趋势和变异程度的指标。2. 常见的错误: 以s描述任何类型资料的特征,尤其是以s描述分布明显呈偏态的资料;混淆标准差与标准误:标准差和标准误是统计学中非常重要的两个概念,虽然二者在本质上是相同的,均是描述资料

26、离散程度的大小,但描述的对象不同,含义自然也不同,标准差描述一组个体观测值的波动情况,而标准误则反映从同一总体中采用同样的抽样方法,固定样本量多次随机抽取的样本均数的波动情况。均数标准差(s),反映在相同实验条件下,观测值在均数附近的波动情况;而均数标准误(s),反映在相同条件下的重复研究中,与m的接近程度。3. 误用实例例1 某研究者在猪活体脑片钙离子荧光强度的测定及对停循环后脑缺血损伤的评价一文中,对资料进行了如下表达,见表15-2。表15-2 猪小脑病理定量(s)组别猪数(只)空泡变性轻度嗜酸性变性中度嗜酸性变性重度嗜酸性变性实验组81120192731200对照组82821253126

27、3218分析:均数标准差(s)用于描述呈正态分布资料的特征,包括平均水平和变异程度;要运用s须先考察资料的分布能否满足正态性。表中的数据明显不符合正态分布的要求,因为如果符合正态分布,均数通常比标准差要大;而表中多数的标准差反而比均数大,有的甚至达4倍。从理论上说,均数不会比标准差小,考虑到抽样误差的影响,标准差可能会大于均数,但通常不会是均数的若干倍;所以,这个资料显然属偏态分布,用s进行描述自然是不适合的。正确的描述指标应是M(Q),即中位数与四分位数间距组合。例2某人在表达正常人与四组患有不同疾病的患者血清PC测定结果时,编制出如下一张统计表,见表15-3。分析:这是一个典型的混淆标准差

28、与标准误的例子,也可能是作者为了让资料的离散度看起来小一点,而采取的一种“补救措施”,即以标准误取代标准差。其实,均数标准差(s)与均数标准误(s)的含义是不同的。另外,用s表达定量资料的结果,同样要求资料满足正态分布。其实我们很容易将数据的标准差算出来,见表15-3最后一列;不难看出,本例资料显示的血清PC值是呈明显偏态分布的。表15-3 正常人与4组不同疾病患者血清PC的测定结果组别例数s(ug/L)P值*标准差D正常人10085.017.5175急性病毒性肝炎22131.130.2 0.05112代偿性肝硬化20266.2157.5 0.001704肝硬化合并肝癌46288.7101.4

29、 0.001687注:*表示各组与正常人比较,D作者根据表中数据还原出来的。(二) 定性资料的统计指标 定性资料是指对每个研究对象的某方面的特征和性质进行表达和描述的资料;可以是名义的,也可以是有序的和等级的。描述指标有率、构成比和相对比等,实际应用中存在的常见问题是,率与构成比的混淆、计算率的分母太小等。1. 误用实例例1 某工厂在“职工健康状况报告”中写道:“在946名工人中,患慢性病的有274人,其中女性219人,占80,男性55人,占20。所以,女性易患慢性病”。分析:该报告的撰写者之所以会下“女性易患慢性病”的结论,显然是根据在274例慢性病中,女性占的比重大于男性所占的比重;误认为

30、构成比大,发病率就高。殊不知,构成比的大小只能反映总体中某一组分所占比重的大小,却不能反映该组分出现的频率或发生的强度;而率的大小则可以较好地反映发生的强度。这里,显然是混淆了率与构成比的涵义,错把构成比当作了率。例2 某研究者在术后病人探视需求的调查分析一文中,根据对外科术后101例病人的探视需求进行了调查,并绘制了一张统计表,见表15-4。表15-4 101例术后病人对探视时机的需求探视时机(术后天数)例数百分率()19 8.922423.834140.642726.7分析:表15-4中百分率实际上表示的是不同探视需求者所相加之和为100,反映一事物内部各组成部分在事物总体中所占的比例,是

31、“构成比”,而非 “率”。 这里用百分率代替构成比显然是不妥当的,应将“百分率”改为“构成比”,最好在表的下部加上“合计”,见表15-5。表15-5 101例术后病人对探视时机的需求(修改)探视时机(术后天数)例 数构成比()1 98.92 2423.83 4140.64 2726.7合计101100.0例3 有研究者用甲药治疗乙病,治疗5例都有效,就认为甲药治疗乙病的有效率为100。分析:这位研究者显然没有把握好正确应用相对数应注意的问题,例数太少,结果的稳定性较差;说不定用同样的方法再治疗5例,都无效也未必不会发生。如果深入分析,大体分为两种情况:第一,如果乙病共有5例,他们全部接受甲药的

32、治疗(疗法相同);在此情况下,若5例均有效,我们是可以下甲药治疗乙病的有效率为100这样的结论的;因为这里没有发生抽样这一过程。第二,如果乙病实际上很多,或者不能明确到底有多少,那么研究者仅对其中的5例采用甲药进行治疗,即使5例均有效,也不能说甲药治疗乙病的有效率为100。因为这里发生了抽样的过程,且不同患者之间病情、性别、年龄等方面存在确定的变异;所以,抽样误差必然存在。二、统计图表(一) 统计表 是用表格的形式来描述统计资料,使统计事物之间的关系条理化、系统化与明晰化,便于对指标进行计算、分析与比较。统计表由标题、标目、线条与数字等四个部分构成,各部分均有相应的要求;如:标题应简明扼要说明

33、统计表的内容,一般不宜超过15个字;横标目各行数字的涵义,纵标目说明各列数字的涵义;通常把主语置于横标目,谓语置于纵标目;表的线条宜少勿多,常用三线表;除顶线、底线以及标目线,绝对不用竖线,特殊情况下可加辅助横线;数字一律用阿拉伯数字,同一指标的小数位数应一致,位次对齐。不规范问题:标题过于简略、甚至不写标题,或过于繁琐以及标题不确切;标目过多、层次不清;线条过多;表内同一指标的小数位数不一致;表中数字代表的含义不清楚。1. 误用实例例1 某研究者在探讨丙型肝炎特异性诊断的比较及其意义时,将研究结果整理成如下表格,见表15-6。分析:用纵标目表示采用的方法(原因),用横标目标表示检测的结果,不

34、符合常规。表格横纵标目的安排,一般要求从左到右阅读可以读成一句话,这样便于理解表格所要表达的意思;另外,表示同一指标数据的小数位要一致。这个表格如能用下面的方式表达,则会更为明了、规范,易于阅读,见表15-7。表15-6 四种方法对104例静脉药瘾者检测结果AbbottCPGORPCR阳性72675248阴性32375256合计10410410410469.264.45046表15-7 四种方法对104例静脉药瘾者检测结果(修改)检查方法人数检出率()阳性阴性合计Abbott723210469.2CP673710464.4GOR525210450.0PCR485610446.2例2 在矽肺动物

35、模型全肺灌洗治疗的病例观察一文中,原作者对10只幼猪给予SiO2染尘处理制作矽肺动物模型,45周后,将其分为药物组、盐水组和对照组;药物组和盐水组分别给予全肺大容量灌洗,对照组不作处理。35月后处死各组动物,观察右肺膈叶表面病变范围,结果整理成如下表(表15-8);经卡方检验,各组间差异有统计学意义(P0.05)。表15-8 各组猪右膈叶矽肺病变范围比较组别病变范围分级盐水组(n4)5025250药物组(n4)2550250对照组(n2)050050分析:对于这个表格中的数字,不知您需要多久才能看明白?列表格的主要目的之一就是要简单明了地表达数据,而这个表格却像个谜!经仔细观察、小心推敲,原来

36、表中的0、25和50表示的既不是病变范围,也不是动物数;而是表示每组动物不同病变范围分级所占的构成比。比如药物组中的25、50、25、0分别表示病变范围在、级的动物数为1、2、1和0只。真让人费解!其实,各组动物数太少,使用百分比表达也是不妥当的。如将表15-8改成如下的形式,则较为妥当,见表15-9。表15-9 各组猪右膈叶矽肺病变范围比较(修改)组别动物数(只)合计盐水组21104药物组12104对照组01012(二) 统计图 是用点的位置、线段的升降、直线的长短或面积的大小等形式,形象而直观地表达被研究事物之间的数量关系。绘制统计图时常犯的错误是:用条图表达各种各样的资料,尤其是表达连续

37、性资料;在坐标轴上随意标刻度。1. 误用实例例1 某研究者将4种处理条件下某定量资料随时间推移的变化数据绘制成条图,见图15-1。(见附页)图15-1 4种不同条件下CFU-GM集落总数随培养时间的变化结果(胡良平,李子建.医统统计学基础与典型错误辨析. 北京:军事医学科学出版社,2003.9. P77)分析:条图适合用来表达彼此之间相互独立项目的数量大小,并不适用于表达某事物或现象随时间推移的变化情况;而培养时间是一个连续性变量,用线图表达最合适,如用条图则割断了时间点之间的联系。例2 某人用狗作为受试对象,研究不同处理条件下血钾浓度随时间推移的变化趋势,使用了普通线图,见图15-2。(见附

38、页)图15-2 注肛组4只狗血钾含量随时间推移的变化趋势(胡良平,李子建.医统统计学基础与典型错误辨析. 北京:军事医学科学出版社,2003.9. P77)分析:选用线图是正确的,但原作者在图坐标刻度的标注上违反了数学原则,即等长的间隔代表的数量却不等。如横坐标上,一会儿代表10min,一会儿代表30min,甚至代表6h;在纵坐标上,一会儿代表3.5,一会儿又代表0.5;这样标注刻度,必然导致图中所反映出来的曲线升降趋势是假像。正确的做法是,将坐标轴上的刻度正确表示出来后再绘图。第三节 医学科研统计推断中的错误统计学中也许有成千上万的方法,但没有哪种方法是万能的;每一种方法均有其应用条件,通常

39、依据资料类型、研究设计方案、统计推断的目的等选择相宜的检验方法。对于定量资料,常用的统计推断方法有t检验、u检验、方差分析等;对于定性资料,最常用的方法则是卡方检验;另外,相关与回归以及非参数检验也是较为常用的推断方法。推断中的常见错误是:应用条件未能满足、或不顾应用条件是否得到满足就随意使用某种检验方法,导致结论可信度低甚至错误;对P值的理解不透彻,导致结论绝对化、把统计学结论等同于专业结论等。一、t检验 t检验最初由W. S. Gosset在1908年以笔名“Student”发表的一篇关于t分布的论文中提出,常见的t检验有单样本t检验、两独立样本t检验和配对样本t检验等三种类型;t检验有其

40、相应的适用条件,如正态性和方差齐性等,适用于两组以下资料的统计分析等。在实际应用中常见的错误是:应用条件不足、设计类型不符、强用t检验分析一切定量资料等。(一) 单样本t检验 单样本均数检验是一种关于总体均数的假设检验问题;这种问题中只有一个随机抽样的样本,研究目的是推断这个样本所代表的总体均数是否等于(或大于,或小于)某个已知的总体均数。本方法的应用条件一般要求样本来自正态分布的总体,特别是样本量较小时;但该法是一个非常稳健的统计方法,只要没有明显的极端值,其分析结果都是比较稳定的。单样本t检验在实际应用中即使存在应用条件不适当的情况,对检验结果的可靠性通常也不会有较大的影响。(二) 两独立

41、样本t检验 该方法常用于解决两个总体均数的比较问题,应用时应满足三个条件:正态性,即各样本均来自正态分布的总体;方差齐性,即各样本所在总体的方差相等;独立性,即各观测值之间是相互独立的,不能互相影响。如果数据不能满足正态性和方差齐性的要求,则应考虑通过适当的数据转换使之满足条件后再进行检验;若转换仍无法满足检验的前提条件,则可考虑采用近似t检验或非参数检验的方法进行分析。该检验方法在实际应用中存在较为严重的错用和误用现象,主要是应用条件不能满足、设计类型不符的情况下强行使用等等。1. 误用实例 为探讨开胃理脾口服液对脾虚小鼠肠功能的影响,某研究者取70只小白鼠,随机分成7组,每组10只;第1组

42、为空白组,给等容生理盐水,其余各组给100大黄水煎液1周(静脉注射,1次/天),造成脾虚模型。停食24小时后,第1、2组静脉注射含10炭末的冷开水,第35组给含10炭末的开胃理脾口服液,第6组给含10炭末的开胃理脾丸剂,第7组给含10炭末的儿康宁。给药30分钟后处死小鼠,打开腹腔,剪取小肠,分别测量小肠总长度和炭末在肠内推进的距离,以推进距离除以小肠总长度计算炭末推进百分率。具体数据见表15-10。原作者用两独立样本t检验处理,结果显示:模型组与空白组比较,差异有非常显著意义,开胃理脾口服液低、中、高剂量与模型组比较,差异有有非常显著意义;提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸

43、剂好。表15-10 各组对小肠运动的影响组别剂量(g/kg)推进率()空白组086.185.18模型组075.835.56*口服液低剂量组2.3491.225.32口服液中剂量组7.0294.206.39口服液高剂量组21.0695.003.87丸剂组2.3480.2012.22儿康宁组2.3492.209.03注:与模型组比较P 0.05,P 0.01;与空白组比较* P 0.05,* P 0.01;与丸剂组比较P 0.05分析:不知您看完上述设计和统计处理,有何想法?我的感觉是杂乱无章!首先是设计乱:作者想通过本次研究,探析多个因素对小鼠肠功能的影响,如是否为脾虚、开胃理脾口服液的剂量、药

44、物剂型、是否服药等;但资料的整理表却显示作者把资料视为单因素7个水平设计的方差分析;这是错误之一。另外,作者反复采用两独立样本t检验进行处理,殊不知这样做会大大增加犯假阳性错误的概率。对于这样的资料应该如何处理呢?实际上我们可对其进行有效的拆分,本例可拆分为如下5种组合:空白组与模型组:成组设计,单因素2个水平,用t检验进行分析,可考察造模是否对小肠功能产生影响。模型组、低剂量组、中剂量组、高剂量组:单因素4个水平,采用方差分析,可考察开胃理脾口服液的剂量对小肠功能的影响是否不同。模型组、低剂量组、丸剂组、儿康宁组:单因素4个水平,采用方差分析,可考察不同药物对小肠功能的影响是否不同。模型组、

45、中剂量组、丸剂组、儿康宁组:分析方法同。模型组、高剂量组、丸剂组、儿康宁组:分析方法同。注意:上述组合给定的分析方法,须满足相应的条件,如正态性与方差齐性;如果不能满足,则考虑运用非参数检验,如秩和检验进行分析。对于后4种组合,若差别经检验有统计学意义,尚须进一步采用Dunnetts t检验分析其余各组与模型组之间的差别是否有统计学意义。(三) 配对样本t检验 在许多科学研究中,常采用配对设计来提高组间的可比性,进而提高研究效率。在配对设计得到的样本数据中,每对数据之间都有一定的相关性,如果忽略了这种关系,就会浪费大量的统计信息,甚至得出错误的结论;因此必须采用相对应的配对设计分析方法进行统计

46、学处理。常见错误是:以两独立样本t检验分析配对设计的资料、采用多次配对样本t检验分析重复测量的方差分析。1. 误用实例例1 为了解某降压药的降压效果,某研究者选取10位高血压病人作为研究对象,在治疗前后对每一位研究对象的舒张压进行测量,结果见表15-11。对这个资料如果采用成组t检验进行分析,资料的正态性和方差齐性(F=0.537,P=0.473)均能得到满足,t=-1.602,P=0.127;结果无统计学意义。表15-11 某降压药治疗前后舒张压的改变情况(mmHg)编号12345678910治疗前120127141107110114115138127122治疗后12310812010710

47、098102152104107分析:这样分析是否妥当,这个结果是否正确呢?其实,不难发现这是一个典型的配对设计,用成组t检验进行分析是不妥当的,因为设计类型不符,独立性得不到满足;采取错误的检验方法得到的统计学结论也未必正确。配对资料是不能拆散的,配比资料不是比较治疗前后两组的均数是否有差别,而是检验每一对子治疗前后差值的均数是否为零。现采用正确的做法,即配对t检验进行分析:对子间舒张压的差值经K-S检验,满足正态性(Z=0.632,P=0.819),t=2.645,P=0.027,按照0.05的检验水准,提示差别有统计学意义;这个结论与经成组t检验分析的结果完全相反。例2 某人采用腰大池腹腔

48、(L-P)分流术治疗脑外伤脑积水30例,分别在术前、术后1周、术后1月测定腰椎穿刺压力,结果见表15-12。采用配对t检验进行统计分析,病人术后1周、1月腰椎穿刺压力与术前相比有明显差异(P0.01或0.001),而术后1月与术后1周比较差异无统计学意义。表15-12 30例L-P分流术前后不同时间腰穿压力变化的比较腰椎压力差值(s)(Pa)配对t值P值术后1周与术前0.7631.2733.2830.01术后1月与术前0.8581.3563.4800.05分析:30例受试对象在三个不同的时间(术前、术后1周、术后1月)对同一个指标(腰穿压力)进行测量,除不同的时间点之外本资料不涉及其他的因素,

49、所以,本资料是非常典型的具有一个重复测量的单因素设计。由于只有一个测量时间因素,所以本例可采用随机区组设计的方差分析进行近似处理;如果结果差异有统计学意义,尚须进一步采用SNK法作两两比较。本资料采用多次配对t检验进行分析显然是不妥的,这样割裂了整体设计,增加了犯第一类错误的概率,结果的可靠性较差。二、方差分析由R.A.Fisher(1923)首先提出,又称为F检验。其基本思想是将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上计算假设检验的统计量F值,实现对总体均数是否有差别的推断。当要比较的样本组数k3时,t检验就不再适用,方差分析则是解决上述问题的重要分析方法。方差分析的

50、常见类型有:完全随机设计的方差分析、随机区组设计的方差分析、重复测量设计的方差分析、析因设计的方差分析、正交设计的方差分析、拉丁方设计的方差分析、嵌套设计的方差分析、裂区设计的方差分析等。方差分析不是万金油,它也有自己的适用条件,如正态性、方差齐性、独立性等。常见错误是:反复运用两独立样本t检验处理各种设计类型的方差分析资料、不顾应用条件是否满足就强行进行方差分析、采用的方差分析方法与设计类型不符等。(一) 完全随机设计方差分析 该类型的方差分析在实际运用中较为广泛,常见错误一:是混淆因素与水平的概念,把多个因素的多个水平混为一谈,作为一个因素多个水平进行分析;常见错误二:是应用条件未能满足而

51、强行使用方差分析;常见错误三:用t检验进行分析;常见错误四:用完全随机设计方差分析去处理其他类型的方差分析,如带有协变量的资料、析因设计资料、具有重复测量的资料等。1. 误用实例例1 外源性的NO供体硝普钠(SNP)对培养心肌细胞DNA具有损伤作用,某人研究超氧化物歧化酶(SOD)和过氧化氢酶(CAT)对心肌细胞的保护作用。将新生Wistar大鼠培养的心肌细胞,随机分成单纯SNP、SNPSOD、SNPCAT、SNPSODCAT等4组,每组5个培养皿;以上各组经5小时避光培养后,将心肌细胞从培养皿上分离并分别进行电泳和染色,在Olympus荧光显微镜下观察DNA迁移度;结果见表15-13,采用单

52、因素方差分析进行处理。表15-13 SOD、CAT加入后DNA迁移度的改变(50个细胞,s)组别DNA迁移度(mm)单纯SNP组48.4921.28SNPSOD组34.249.86SNPCAT组41.1411.22SNPSODCAT组29.458.69注:与单纯SNP组比,:P 0.01;与SNPSOD组比,:P 0.05,P 0.01;与SNPCAT组比,:P 0.01分析:从表15-13中组别可以看出,各组的SNP是相同的,所以SNP不应作为一个因素;因为要作为一个因素,其实验条件至少要有两种。进一步分析,可以发现这四组涉及到两个因素,即SOD加否和CAT加否,并不是单因素4个水平的设计;

53、本资料实际上一个22的析因设计,采用单因素方差分析显然是不妥当的。例2 为探讨尼莫地平对新生儿缺氧缺血性脑病(HIE)的治疗作用,将患有HIE的新生儿43例,分为尼莫地平治疗组21例和对照组22例。治疗组于生后12小时内开始使用尼莫地平口服治疗,其余治疗和处理于对照组相同;两组于生后12小时、24小时何72小时监测RBC TCa和Ca2i的含量(见表15-14)。采用t检验和方差分析进行统计处理,结果显示:对照组12小时、24小时,RBC TCa和Ca2i的含量均高于治疗各时相组,差异具有统计学意义(P 0.01);由此得出结论:早期使用尼莫地平能阻止Ca2内流,从而达到保护神经元、改善临床症

54、状的作用。表15-14 治疗组与对照组各时相两两比较时间(h)组别例数Ca2i(s)TCa(s)12对照组222.29230.37814.73140.480424对照组221.87160.24004.00710.273372对照组221.18860.24002.99790.273312治疗组211.27240.20493.58240.377524治疗组211.13040.15273.08290.267672治疗组211.15780.25222.68700.4078F7.13242.9481P 0.01 0.05分析:本例采用单因素多水平设计定量资料的方差分析对资料进行处理是不妥的,因为这里的数

55、据之间不能满足独立性的要求,同时,设计类型既不是成组设计也不是单因素多水平设计。该资料涉及到两个因素,即使用尼莫地平与否和测量时间,其中前者为分组因素、后者是与重复测量有关的实验因素;这是一个具有一个重复测量的两因素设计定量资料。正确的处理方法是:采用具有一个重复测量的两因素设计定量资料的方差分析对资料进行处理,如果在不同时点上测量值的差异有统计学意义,还须进一步做两两比较。(二) 随机区组设计方差分析 对于随机区组设计的资料采用t检验或完全随机设计的方差分析进行处理,都是较为常见的误用现象。1. 误用实例 某研究者将13人份高胆固醇结石,每份4枚,且4枚结石在外形、重量上相近;每份中的1枚作

56、CT分型、生化分析和剖面结构观察,另3枚分别采用超生助溶、灌注助溶、静置对照三种方法溶石,见表15-15。采用t检验进行统计处理,得出结论:超声可促进非钙化石的溶解,超声组于灌注组比较,有显著性差异(P0.05),与静置组比较,有非常显著型差异(P0.001)。表15-15 结石溶解时间结石号溶解时间超生*灌注静置140436442303669032530645432353905223542061316700781569081230570981367010101869011141666012101571213202567619.1525.77627.46Sd10.7110.75105.15*与

57、比较,P0.01;*与比较P0.001分析:该研究者在分组时,将结石的来源、外形和重量作为重要的区组因素,并把同一区组中的3枚结石采用随机的方法分配到了3个不同的处理组;研究者在考虑重要的实验因素的同时,还考虑了对实验结果可能造成重要影响的非处理因素(区组因素),此类实验设计是很好的配伍组设计。此类设计应采用随机区组的方差分析法进行统计处理,用t检验进行处理,显然是不妥当的。(三) 重复测量设计方差分析 无视重复测量数据间相关性,采用t检验或单因素多水平设计的方差分析去处理具有重复测量设计的定量资料,是较为常见的误用之一。1. 误用实例例1 某人研究脑梗死组中不同的分子量的蛋白质磷酸化情况,见

58、表15-16。原作者采用t检验处理,并将同一分子量及同一时间点上不同组别的数据采用t检验进行比较。表15-16 不同组别各两例患者底物蛋白磷酸化放射活性(cpm)测定结果组别底物蛋白磷酸化放射活性(cpm)A组: 0310B组: 0310对照组211926083213194224892824213026303305200124992903脑梗死组419053197010231832474305419953276995243833484509注:A组:蛋白质分子量为47000,B组:蛋白质分子量为20000。分析:这个资料虽然是定量的,但采用t检验进行分析显然是不妥当的。正确的分析方法应是怎样的

59、呢?要回答这个问题,除对资料的类型作出正确判断外,还要弄清资料的设计类型。这个资料中实际涉及到三个因素,即蛋白质分子量大小、是否伴有脑梗死、测量时间,前两个是分子因素,测量时间是与重复测量有关的实验因素;这个资料应是具有一个重复测量的三因素设计定量资料,将资料进行重新整理,将更容易弄清设计类型(见表15-17)。对该资料,正确的方法是采取相应设计定量资料的方差分析进行处理,而不是简单地用t检验进行处理。表15-17 对照组及脑梗死组底物蛋白磷酸化放射活性(cpm)测定结果组别分子量底物蛋白磷酸化放射活性(cpm)测定时间(h)0310对照组470002119260832132130263033

60、0520000194224892824200124992903脑梗死组4700041905319701041995327699520000231832474305243833484509例2 如“完全随机设计方差分析”部分的误用实例2,也属于重复测量设计方差分析的误用。(四) 析因设计方差分析 常见错误是:采用t检验或单因素多水平设计的方差分析去处理具析因设计的资料。1. 误用实例例1 原文题目:营养不良对幼鼠癫痫持续状态后海马神经发生影响的研究。目的是探讨发育期营养不良伴发癫痫持续状态对海马神经发生的影响,原作者将28只新生Wistar大鼠建立模型后分成4组,分别为营养良好组、营养不良组、营

61、养良好与惊厥组、营养不良与惊厥组,每组7只大鼠;测量各组齿状回Brdu阳性细胞数(资料见表15-18),并采用t检验比较得出不同营养状态下Brdu阳性细胞数差别有统计学意义(P0.01),有无惊厥组间的差别也有统计学意义(P0.01)。表15-18 营养状态及有无惊厥幼鼠齿状回的Brdu阳性细胞数(s)营养状态Brdu阳性细胞数单纯组伴惊厥组不良组3032037418良好组2691831224分析:本研究设立4个实验,涉及到两个实验因素,分别是“是否营养不良”和“是否伴有惊厥”,每个因素均有两个水平;实际上研究中的4个组正是两个因素不同水平组合的结果,这个一个典型的两因素两水平的析因设计;如果资料满足正态性和方差齐性,应采用析因设计的方差分析进行统计处理。但遗憾的是,原作者却采用成组样本的t检验进行两次分析;能造成这种现象原因很多,可能是不了解析因设计,而对成组设计的t检验则非常熟悉。诚然,对于析因设计资料,采

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!