医学科研设计方案与统计学思维

上传人:仙*** 文档编号:230502022 上传时间:2023-08-25 格式:PPT 页数:63 大小:1.16MB
收藏 版权申诉 举报 下载
医学科研设计方案与统计学思维_第1页
第1页 / 共63页
医学科研设计方案与统计学思维_第2页
第2页 / 共63页
医学科研设计方案与统计学思维_第3页
第3页 / 共63页
资源描述:

《医学科研设计方案与统计学思维》由会员分享,可在线阅读,更多相关《医学科研设计方案与统计学思维(63页珍藏版)》请在装配图网上搜索。

1、浙江大学公共卫生学院流行病与卫生统计学科系 沈毅医学科研设计方案与统计学思维 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望浙江大学公共卫生学院流行病与卫生统计学科系 沈毅医学统计学要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付一般的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在SCI杂志上,乱用统计学的现象多

2、如牛毛。很多人在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是我们在学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的本身的特点。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 没有设计的临床干预试验没有设计的临床干预试验 16851685年年抢抢救救英英国国国国王王查查理理二二世世(Charles Charles II II,1630-1630-16851685):):“一一品品脱脱(0.568L0.568L)血血从从右右臂臂放放出出,半半品品脱脱血血从从左左肩肩放

3、放出出,服服下下催催吐吐剂剂、两两付付汤汤药药和和一一种种由由1515成成份份的的灌灌肠肠剂剂。刮刮国国王王的的头头部部,直直到到起起一一个个大大泡泡。再再服服打打喷喷嚏嚏的的药药粉粉和和更更多多的的催催吐吐剂剂。继继续续放放血血,加加服服止止痛痛剂剂。把把沥沥青青和和鸽鸽子子粪粪混混合合后后敷敷于于脚脚上上。服服一一种种含含有有1010种种成成份份的的草草药药。最最后后服服人人头头盖盖骨骨粉粉制制成成的的4040滴滴糖浆,外敷牛黄。然后,国王陛下死了。糖浆,外敷牛黄。然后,国王陛下死了。”浙江大学公共卫生学院流行病与卫生统计学科系 沈毅有设计的临床干预试验有设计的临床干预试验1747年5月2

4、0日,英国的J.Lind医生将12名病情相同似的患者带到一艘船上。患者的主要症状是牙龈溃烂,皮肤有出血点,双膝无力。Lind将12名患者分为6组,分别给予下列主要干预:A组:每天饮1夸脱(1.136L)苹果汁;B组:服25滴硫酸丹剂(elixir vitriol),每天3次;C组:服2匙醋,每天3次;D组:每天饮约半品脱海水,服缓和的泻药;E组:每天食2个桔子,一个柠檬;F组:每天服由大蒜、芥子等成份组成的干药。当当6 6月月1616日日船船返返回回英英国国PlymouthPlymouth港港时时,所所有有患患者者的的病病情情都都有有好好转转,其其中中E E组组恢恢复复的的最最快快、最最好好,

5、其其中中一一人人到到第第6 6天天就就可可以以工工作作了了。B B组组也也有有一一人人比比登登船船时时健健康康。LindLind医医生生的的试试验验并并没没有有得得出出明明确确的的结结论论,直直到到160160年年后后,通通过过动动物物实实验验才才真真正正从从科科学学意意义义上上解解释释了了E E组组疗效最好的真正原因。疗效最好的真正原因。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅J.Lind医生的研究有二点符合统计学的设计:1、设立了对照(相互对照);2、质量控制(消除了一些混杂)。如果我们今天重复J.Lind的研究,在统计设计的上还需要做到以下几点:1、研究对象的定义与纳入标准和排除

6、标准2、足够多的观察对象3、效应指标的选择4、结论是否能外推浙江大学公共卫生学院流行病与卫生统计学科系 沈毅统计学方法用于干预试验统计学方法用于干预试验 1835年,法国医生年,法国医生P.C.A.Louis 对当时流行的对当时流行的“放血放血”疗法治疗肺炎的效果疗法治疗肺炎的效果进行了比较,发现进行了比较,发现“放血放血”的疗效不象预期的那么好,而且早期的疗效不象预期的那么好,而且早期“放血放血”和晚和晚期期“放血放血”组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期平均治愈时间意义不大。因为晚

7、期“放血放血”组的平均治愈时间长,但该组患者组的平均治愈时间长,但该组患者病情重、病程长、年龄大。病情重、病程长、年龄大。Louis对医学研究的方法学作出了很大贡献:对医学研究的方法学作出了很大贡献:(1)用数字的方法表示不同疾病患者的特征和预后;)用数字的方法表示不同疾病患者的特征和预后;(2)提出了临床疗效对比的前瞻性原则;)提出了临床疗效对比的前瞻性原则;(3)提提出出抽抽样样误误差差和和混混杂杂(confounding)概概念念。其其中中前前瞻瞻性性研研究究和和减减少少混混杂,分别成为当今临床试验和流行病学研究的基本研究方法;杂,分别成为当今临床试验和流行病学研究的基本研究方法;(4)

8、在在J.Gavarret 的的协协助助下下,Louis的的数数字字方方法法发发展展为为“概概率率框框架架”,Gavarret也于也于1840年在巴黎出版了世界第一部医学统计学教科书。年在巴黎出版了世界第一部医学统计学教科书。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”F.Yates,M.J.R.Healy医学论文中的统计问题医学论文中的统计问题 统计知识的运用统计知识的运用 撰写论文:报告自己观察或实验的研究结果撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展阅读论文:吸收新知识

9、,了解学术进展 1996年,对申报科技成果的年,对申报科技成果的4586篇科研论文分析,篇科研论文分析,统计方法使用率为统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。还可能导致严重的伦理学问题。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅“调查结果反映了医学论文作者统计知识和统计水平的调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生物统计学者不是令人生畏的检查低下,也再次强调了生物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟友。生物官。恰恰相反,生物统计

10、学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱学科,就像大厦中的一个支柱”-JAMA-JAMA的编辑部的编辑部60年年代代到到80年年代代,国国外外医医学学杂杂志志调调查查结结果果:有有统统计计错错误误的的论文论文20%72%。1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华华妇妇产产科科杂杂志志、中中华华儿儿科科杂杂志志595篇论文的调查结果:篇论文的调查结果:相对数误用为相对数误用为11.2%抽样方法误用抽样方法误用15.9%统计图表误用

11、统计图表误用11.7%1996年年对对4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅科学容不得半点虚假,造假者一旦被科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱揭露就背上了永远洗脱不掉的耻辱 。伪造统计数据违反科学道德伪造统计数据违反科学道德 据据1976年年New Science 杂志关于科研舞弊行为的调杂志关于科研舞弊行为的调查查74%的调查表反映有不正当修改数据的情况,其中,的调查表反映有不正当修改数据的情况,其中,17%拼凑实验结果,

12、拼凑实验结果,7%凭空捏造数据,凭空捏造数据,2%故意曲解故意曲解结果。结果。就统计学本身来说,正确实验设计得出的统计结果,就统计学本身来说,正确实验设计得出的统计结果,是用是用P值作为值作为“重现性重现性”的概率保证。的概率保证。P0.05,就是,就是说实验结果显示的差别是机遇所致的可能性不足说实验结果显示的差别是机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的试验,得出或者说,别人在同样的条件下重复同样的试验,得出相反结论的可能性不足相反结论的可能性不足5%。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统

13、计量 参参参参 数数数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)包括:点估计与包括:点估计与区间估计区间估计2.假设检验假设检验(test of hypothesis)浙江大学公共卫生学院流行病与卫生统计学科系 沈毅总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数

14、 统计推断统计推断抽样误差抽样误差如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率 抽样误差抽样误差 (sampling sampling error)error):由:由于个体差异导于个体差异导致的致的样本样本统计统计量与量与总体总体参数参数间的差别。间的差别。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 统计的结论是推断而不是证明,正确的统计结论必须统计的结论是推断而不是证明,正确的统计结论必须建立在科学的设计和合适的统计方法上,否则得到是不恰建立在科学的设计和合适的统计方法上,否则得到是不恰当或是错误的结论

15、。当或是错误的结论。1、收集数据的方法(研究假说、调查或实验设计、误、收集数据的方法(研究假说、调查或实验设计、误 差和偏倚的控制等)差和偏倚的控制等)2、分析数据的方法(变量的类型、数据的分布、研究、分析数据的方法(变量的类型、数据的分布、研究 目的和因素等)目的和因素等)3、结论的外推(统计结论是否适合所有研究对象)、结论的外推(统计结论是否适合所有研究对象)浙江大学公共卫生学院流行病与卫生统计学科系 沈毅1.采用统计学方法,发现不确定现采用统计学方法,发现不确定现象背后隐藏的规律。象背后隐藏的规律。变异变异(variation)是社会和生物医学中的)是社会和生物医学中的普遍现象。普遍现象

16、。变异使得实验或观察的结果具有变异使得实验或观察的结果具有不确定性不确定性,如每个人的身高、体重、血压等各有不同。如每个人的身高、体重、血压等各有不同。一、为什么要学统计学?一、为什么要学统计学?浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅案例一:两个指标诊断疾病的问题案例一:两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结

17、果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。路人乙是这篇文章的审稿人,当他看见这个结论后,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢Reject!这个例子说明:这个例子说明:统计指标选错了统计指标选错了,统计出来的东西往往难以,统计出来的东西往往难以

18、“自圆其自圆其说说”。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上

19、看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是随机误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。又Reject!这个例子说明:在医学科研中,这个例子说明:在医学科研中,没有经过统计学检验的结论没有经过统计学检验的结论杂志社多半认为是不科学的。杂志社多半认为是不科学的。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅稿件又被退了,路人甲很是郁闷。他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。接下来的事情就是改稿,然后另选杂志继续投稿。路人甲在文稿中特

20、别注明了,曲线下面积是经过了统计学检验的,B的曲线下面积(0.82)与A的曲线下面积(0.80)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明P=0.01。路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明B的诊断效率是优于A的。路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:B是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。A是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。所以作者的结论(B比A优秀)是不可靠的。再说得通俗点,如果把A和B分别理解成法庭上的原

21、稿和被告,那B无疑既充当了辩护律师,又充当了法官的角色。在这种情况下,A输掉了官司是十分正常的。如果换一个公平的、独立的法官来断案,B能否胜出就不好说了。再一次Reject!这个例子说明:这个例子说明:实(试)验设计有缺陷,即便是统计学方法实(试)验设计有缺陷,即便是统计学方法准确也于事无补准确也于事无补。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅稿件又一次被退了,路人甲的心情极度郁闷。思来想去,决定把实验重做一遍,让A和B在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。在新开展的研究中,A和B都是对临床医生设盲的,不可能影响金标准。这下A和B的比较结果应该比较可靠了吧,路

22、人甲又仰天长叹了一口气,感觉自己如释重负了。科研太折腾人了,太不容易了!统计结果很快出来,A的曲线下面积是0.80,B的曲线下面积则变成了0.77,经过统计学检验后发现,A的诊断效能确实是高于B的。整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:A和B的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。读者最关心的问题显然不是A和B“孰强孰弱”的问题,虽然这个问题有一定的专业价值。如果我是坐诊医生,我会说

23、:A和B谁强谁弱关我什么事?总之来一个病人我就A和B都检测,我的患者都不差钱!作者的研究重点应该是明确A和B能否互补,联合使用是否能有助于提高诊断准确性的问题,而非A和B“孰强孰弱”的问题。简单地说,就是明确1+1是否大于1的问题。还是被Reject!(作者吐血)这个例子说明:这个例子说明:研究方向错了,即使是无懈可击的实研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。(试)验设计和天衣无缝的统计方法,也是无济于事。这四个例子说明:医学科研是很痛苦的,不重视统计学和科这四个例子说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。研设计,会走很多弯路

24、的。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅2.用统计学思维方式考虑有关医学研用统计学思维方式考虑有关医学研究中的问题究中的问题 “阳性阳性”结果是否是虚假联系?结果是否是虚假联系?某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒药十,能否说该感冒药十分有效?分有效?以前的许多研究表明,血清甘油三酯的含量与冠心病危险以前的许多研究表明,血清甘油三酯的含量与冠心病危险性有关,即甘油三酯的含量越高,患冠心病的危险性就越大。性有关,即甘油三酯的含量越高,患冠心病的危险性就越大。有的医生以此筛选危险人群?有的医生以此筛选危险人群?冠心病甘油三酯胆固醇+高密度脂蛋白虚假

25、联系浙江大学公共卫生学院流行病与卫生统计学科系 沈毅案例二案例二,如何看待统计学结果如何看待统计学结果路人甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P0.0001)。路人甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是路人甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白

26、A和AFP的相关性十分明显。如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?Reject!这个例子说明:这个例子说明:统计学阳性的结果未必是统计学阳性的结果未必是“好结果好结果”。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅如:当专业上有一定联系的两个变量之间的变化呈“S型”或“倒S型”曲线趋势时,若错误地用直线方程去描述,从统计学角度看效果也很好,但在专业上是解释不通的。再比如,某两个统计量(如均值、率等)之间的差别在统计学上有显著性意义,有时在专业上并

27、无实用价值。如某种新的降压药,平均降低血压2mmHg,若样本含量较大,误差又较小,统计检验可能会得到“P0.05”的结果,但在临床上却认为此新药的疗效没有多大提高。另外,在运用统计学中,稍有不慎都可能犯这样或那样的错误。因此,统计结论的可靠性仍需通过实践去检验。所以,应当牢记:运用统计学时必须结合医学实际,才能真正发挥统计学应有的作用。组别N基线血压(mmHg)治疗后血压(mmHg)标准差(mmHg)P值95%CI(mmHg)统计学意义临床意义治疗组20016014260.050.83.2有无对照组2001601446有统计学(差异)意义,并不代表有生物学、临床意义有统计学(差异)意义,并不代

28、表有生物学、临床意义浙江大学公共卫生学院流行病与卫生统计学科系 沈毅案例三,降糖药的研究、学生自杀事件案例三,降糖药的研究、学生自杀事件某医生长期从事降糖药的研究,最近他发现了一种药物,可以降低患者的血糖。为了评价该药的降糖效果,路人甲费尽心机地设计了一个看似完美的随机对照试验(RCT),为了保证结果可靠,路人甲严格遵守RCT设计准则,包括随机、双盲、安慰剂对照等措施。研究结果表明,实验组和对照组在接受药物治疗前血糖浓度的均值都是10mmol/L,差异无统计学意义,表明两组研究对象的基线特征具有可比性。对照组未经任何药物治疗(为便于描述,此处忽略医学伦理学问题),血糖浓度还是10mmol/L;

29、实验组经过药物干预后,血糖浓度变成了9mmol/L,统计学检验结果表明,实验组和对照组治疗后的血糖浓度的差异是有统计学意义的(P0.01)。路人甲赶紧撰写论文,并毫不客气地给研究下了个结论:该药可以降低患者血糖。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:却要确实可以降低血糖,但是一个只能降低1mmol/L的降糖药有何临床价值?Reject!这个例子说明:这个例子说明:有统计学意义不一定有专业意义。有统计学意义不一定有专业意义。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅某CDC做了一个调查,同处一地的A

30、和B两所中学,各有1000名学生,过去的一年,A校有5名学生自杀(自杀率为0.5%),B校没有学生自杀(自杀率为0%)。统计学结果表明,两校自杀率的差异无统计学意义(P=0.07,Fisher确切概率法)。于是写论文得出结论:A和B两校的自杀率是没有统计学上的差异,A校5名学生自杀纯属小概率事件。路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:5个鲜活的生命就这样没有了,5个家庭就这样毁了,你却告诉我这纯属小概率事件,你就不怕“人神共愤”吗?Reject!这个故事说明:这个故事说明:有专业意义不一定有统计学意义。有专业意义不一定有统计学意义。这两个故事说明:统

31、计学只是方法学,医学科研中需要借这两个故事说明:统计学只是方法学,医学科研中需要借助统计学方法来发现事物的规律性,但助统计学方法来发现事物的规律性,但不能死磕统计。不能死磕统计。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅例:某医生用一种新的治疗某病的疗法(简称治疗组),用现在公认的疗法作为对照(简称对照组),经临床试验,对照组和治疗组的疗效分别为P1=75%与P2=95。问:能认为这两个有效率之间的差别有显著性意义吗?答:这两个有效率之间的差别可能有统计学意义,也可能没有统计学意义。因为其结论不仅取决于二者之差的绝对值大小,更主要的是取决于随机误差的大小和样本大小,千万不可轻率地作出统计

32、推断。现假定这两个有效率分别来自下列甲、乙、丙三批实验的结果,则具有下列3种不同的统计检验结果。“阴性阴性”结果是否是样本含量不足?结果是否是样本含量不足?有人曾对发表在有人曾对发表在Lancet,N Engl J Med,JAMA等著名医学杂志上的等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有篇阴性结果的论文作过分析,发现其中有62篇(篇(93%)可能是由于)可能是由于样本含样本含量量不足造成的假阴性。不足造成的假阴性。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅表1、两个有效率的比较甲实验中,P1与P2之间的差别无统计学意义(校正2=1.765,P0.05)乙实验中,P1与

33、P2之间的差别有统计学意义(26.275,0.01P0.05);丙实验中,P1与P2之间的差别也有统计学意义(29.412,P0.01)。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学科系 沈毅案例四:路人甲发明了两套诊断肺癌的方案,分别命名为A和B。为了明确这两种方到底谁“更胜一筹”,路人甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100例,准确率50,方案B仅仅正确了50例,准确率仅为25%。卡方检验结果:方案A和B准确率之间的差异

34、有统计学意义(P0.01)。很明显,方案A的准确性要高于方案B。路人甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:如果我(审稿人本人)是坐诊医生,他就会反着看方案B的结果,凡是方案B认为是肺癌的,他就认为病人不是肺癌;反之亦然。这样下来,200个病人中,方案B应该能正确识别150个人,准确率为75%,统计学结果表明,方案B的准确率(75%)是高于方案A(50%)的,所以真实的情况是方案B优于方案A。实际上,当面对这200名患者的时候,随便到城隍庙找个瞎子来“算命(猜患者是否患病)”,按照统计学理论,准确

35、率也应该是50%,方案A的价值可以说是“一无是处”。Reject!这个例子说明:这个例子说明:统计学阴性的结果未必是统计学阴性的结果未必是“坏结果坏结果”。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅3.保证你的研究论文能通过统计学审查保证你的研究论文能通过统计学审查据国外据国外6080年代对不同医学杂志发表论文的年代对不同医学杂志发表论文的调查,有调查,有统计错误的论文的百分比最高达统计错误的论文的百分比最高达72%,最,最低也有低也有20%。国内国内1984年对年对中华医学杂志中华医学杂志、中华内科中华内科杂志杂志、中华外科杂志中华外科杂志、中华妇产科杂志中华妇产科杂志、中华儿科杂志中

36、华儿科杂志595篇论文的调查结果,相对数误篇论文的调查结果,相对数误用为用为11.2%,抽样方法误用,抽样方法误用15.9%,统计图表误用,统计图表误用11.7%。某研究者。某研究者1996年对年对4586篇论文统计(中华篇论文统计(中华医学会系列杂志仅占医学会系列杂志仅占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 JAMA,新新英英格格兰兰医医学学杂杂志志(NEJM)、英英国国医医学学杂杂志志、中中华华医医学学会会杂杂志志对对来来稿稿都有统计学要求都有统计学要求或统计学指导。或统计学指导。国国际际生生物物医医学学杂杂志志编

37、编辑辑协协会会在在其其生生物物医医学学期期刊刊投投稿稿的的统统一一要要求求中中也也包包含含了统计学要求。了统计学要求。UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournalshttp:/www.acponline.org浙江大学公共卫生学院流行病与卫生统计学科系 沈毅中华医学杂志中华医学杂志对来稿中统计学处理的有关要求对来稿中统计学处理的有关要求1统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计统计研究设计:应交代统计研究设计的名称和主要做法。如调查设计(分为前瞻性、回顾性或分为前瞻性、回顾性或横断面调查研究横断面

38、调查研究);实验设计;实验设计(应交代具体的设计类型,如自身配对设计、成组设计、交叉设计、应交代具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等析因设计、正交设计等);临床试验设计;临床试验设计(应交代属于第几期临床试验,采用了何种盲法措施等应交代属于第几期临床试验,采用了何种盲法措施等)。主要做法应围绕主要做法应围绕4个基本原则个基本原则(随机、对照、重复、均衡随机、对照、重复、均衡)概要说明,尤其要交代如何控制重要非试概要说明,尤其要交代如何控制重要非试验因素的干扰和影响。验因素的干扰和影响。2资料的表达与描述:用资料的表达与描述:用x 和和s表达近似服从正态分布的

39、定量资料,用表达近似服从正态分布的定量资料,用M(Q)表达呈偏态分布的表达呈偏态分布的定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统定量资料;用统计表时,要合理安排纵横标目,并将数据的含义表达清楚;用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;用相对数时,分母不宜小于宜小于2O,要注意区分百分率与百分比。,要注意区分百分率与百分比。3统计分析方法的选择:对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析统计分析方法的选择:对于

40、定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用目的,选用合适的统计分析方法,不应盲目套用t检验和单因素方差分析;对于定性资料,应根检验和单因素方差分析;对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用方法,不应盲目套用2 检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,检验。对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实

41、验数据的回归分析资料,不应简单化处理;对于不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理;对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系进行全面、合理的解释和评价。的交互作用和多指标之间的内在联系进行全面、合理的解释和评价。4统计结果的解释和表达:当统计结果的解释和表达:当P005(或或P001)时,应说明对比组之间的差异有统计学意义,时,应说明对比组之间的差异有统计学意义,而不应说对比组之间具有显著性而不

42、应说对比组之间具有显著性(或非常显著性或非常显著性)的差别;应写明所用统计分析方法的具体名称的差别;应写明所用统计分析方法的具体名称(如:如:成组设计资料的成组设计资料的t检验、两因素析因设计资料的方差分析、多个均数之间两两比较的检验、两因素析因设计资料的方差分析、多个均数之间两两比较的q检验等检验等),统,统计量的具体值计量的具体值(如如t=345,X2=468,F=679等等)应尽可能给出具体的应尽可能给出具体的P值值(如如P=0.0238);当涉;当涉及到总体参数及到总体参数(如总体均数如总体均数 总体率等总体率等)时,时,在给出显著性检验结果的同时,再给出在给出显著性检验结果的同时,再

43、给出95置信区间。置信区间。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅还是那个AFP与蛋白A的例子。路人甲发现蛋白A和甲胎蛋白(AFP)之间有很好的相关性,也开始撰写论文,但是他的结论并不是“蛋白A是诊断肝癌的标记物”。他认为,既然蛋白A与AFP之间有很强的相关性,那提示AFP和蛋白A之间可能存在十分密切的“调节”或者“被调节”关系。最终,路人甲围绕“蛋白A与AFP之间的调节或者被调节关系”做了很多分子生物学试验,指出蛋白A是调节AFP表达的唯一(注意“唯一”这两个字)因子,因此二者之间才会呈现如此强烈的相关性。这是一项基础研究,虽然未能直截了当地地指出蛋白A的临床价值,但是这个研究形象

44、生动地讲述了一个完整的分子生物学事件,丰富了我们对于肝癌发生与发展分子机制的认识。最终,论文“堂而皇之”地accept了。这个例子说明:这个例子说明:同一统计学结果,从不同的专业角度去解释,同一统计学结果,从不同的专业角度去解释,结论是完全不同的。结论是完全不同的。以上所有案例说明:对统计学结果的解读一定要结合专业!以上所有案例说明:对统计学结果的解读一定要结合专业!从从专业中来,到专业中去!专业中来,到专业中去!浙江大学公共卫生学院流行病与卫生统计学科系 沈毅4.获得循证医学证据的主要手段获得循证医学证据的主要手段“良良 好好 愿愿 望望 的的 医医 学学”(well-meaning med

45、icine)转转入入“以以证证据据为为基基础础的的医医学学”(evidence-based medicine,EBM)需需要要有统计学方法的支持。有统计学方法的支持。全全世世界界的的医医学学期期刊刊每每年年大大约约刊刊登登600600万万学学术术论文,但能作为可靠论文,但能作为可靠“证据证据”的论文并不多。的论文并不多。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 二、二、医学科研的基本要素医学科研的基本要素医学科研由三个基本部分组成,即处理因素(studyfactor)、受试对象(studyobject)和实验效应(experimentaleffect)。例如,观察流甲丙脯酸对肾性高血压

46、患者的疗效。其中,疏甲丙脯酸为处理因素,肾性高血压患者为受试对象,动脉压变化为试验效应。通常将这三个组成部分称为医学科研的基本要素。如何正确选择三个要素,是科研设计的关键问题。StudyfactorStudyobjectExperimentaleffect浙江大学公共卫生学院流行病与卫生统计学科系 沈毅1、医学研究设计的基本原理、医学研究设计的基本原理:降压药高血压病人血压值TseT+S=e基本模式基本模式:T+s1=e1=20mmHgO+s2=e2=5mmHgT-O=e1-e2=20-5Te=15mmHg处理因素的作用被单独的显示处理因素的作用被单独的显示统计分析的思维:在排除或控制了一些可

47、能影响实验效应的因素后,以概率为基础计算其差异是否为随机误差(偶然性结果),从而推断处理因素(或暴露)的效应是否不为零。处理效应(暴露)(目标人群)(发病风险)处理组:对照组:研究假说:处理效应不为零统计假设:处理效应为零浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 医学科研类型由于不同的科研目的,有多种不同的分医学科研类型由于不同的科研目的,有多种不同的分类方法。如,按科技活动类型分为基础研究、应用研究和类方法。如,按科技活动类型分为基础研究、应用研究和开发研究(发展研究);按照医学中各专业的属性,可分开发研究(发展研究);按照医学中各专业的属性,可分为:基础医学科研、临床医学科研、预防

48、医学科研、社会为:基础医学科研、临床医学科研、预防医学科研、社会医学科研(包括卫生事业管理学研究和医学心理学科)。医学科研(包括卫生事业管理学研究和医学心理学科)。一般来说,医学科研的分类,常按设计类型的不同,分为一般来说,医学科研的分类,常按设计类型的不同,分为以下几种基本类型。(图以下几种基本类型。(图1-11-1)浙江大学公共卫生学院流行病与卫生统计学科系 沈毅普查普查抽样调查抽样调查典型调查典型调查横断面研究(现况研究横断面研究(现况研究)常规资料分析报告常规资料分析报告描述性研究描述性研究个案调查(病例、病例家属、周围概况个案调查(病例、病例家属、周围概况))生态学研究(相关研究)生

49、态学研究(相关研究)病例对照研究(探索性、验证性)病例对照研究(探索性、验证性)队列研究(历史性、同时性)队列研究(历史性、同时性)观察性研究观察性研究医学科研方法医学科研方法巢式病例对照研究巢式病例对照研究病例病例研究病例病例研究病例队列研究病例队列研究多阶段复合设计研究多阶段复合设计研究分析性研究分析性研究 实验室试验实验室试验 临床试验临床试验 社区试验社区试验实验性研究实验性研究理论性研究(数学模型研究)理论性研究(数学模型研究)图图1-1 1-1 医学科研方法基本类型医学科研方法基本类型浙江大学公共卫生学院流行病与卫生统计学科系 沈毅2、医学研究设计的医学研究设计的4个基本原则个基本

50、原则重复、随机、对照、均衡是实验设计的4个基本原则,在实验设计中务必要严格遵守。否则,实验研究结果的可靠性将大受影响。所谓重复,就是实验因素各水平组合下要有足够的样本含量。因为统计学研究的是随机现象的变化规律性,重复次数少,内在规律表现不出来。在统计学上可根据设计类型选用相应的样本含量估算公式进行计算。所谓随机,就是每一个实验单位都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。在统计学上有许多实现随机化的具体方法,应当严格实施。千万不可用“随便”取代随机。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅所谓对照,就是要设立参照物。因为没有对比,就无法鉴别优劣。例如,要

51、考察一种新的抗所谓对照,就是要设立参照物。因为没有对比,就无法鉴别优劣。例如,要考察一种新的抗癌药的疗效如何,必须设立一个对照组。在对照组里的癌症患者,可以什么抗癌药都不用癌药的疗效如何,必须设立一个对照组。在对照组里的癌症患者,可以什么抗癌药都不用(称为空白对照,在临床上应当慎用这种对照),亦可以用现在公认的最好抗癌药作为对照(称为空白对照,在临床上应当慎用这种对照),亦可以用现在公认的最好抗癌药作为对照药(称为标准对照)。药(称为标准对照)。在在研研究究干干预预措措施施的的效效果果时时,直直接接观观察察到到的的往往往往是是多多种种因因素素的的效效应应交交织织在在一一起起的的综综合合作作用用

52、,而而合合理理的的对对照照能能成成功功地地将将措措施施的的真真实实效效应应客客观观、充充分分地地识识别别出出来来,使使研研究究者者得得以以做做出出正正确确评评价价。一般来说,设立对照可以最大可能地避免下列因素或现象对临床试验研究结果的影响:一般来说,设立对照可以最大可能地避免下列因素或现象对临床试验研究结果的影响:不不能能预预知知的的结结局局(unpredictable outcome),由由于于人人类类认认识识的的局局限限性性,干干预预效效应应受受一一些些目目前未被认识的潜在未知因素的影响。前未被认识的潜在未知因素的影响。向向均均数数回回归归(regression to the mean)在

53、在临临床床实实践践中中,有有些些极极端端的的临临床床症症状状或或体体征征有有向向均均数回归的现象。数回归的现象。所谓均衡,就是要设法使各条件(即实验因素的各水平组合)下的受试对象受到非实验因素所谓均衡,就是要设法使各条件(即实验因素的各水平组合)下的受试对象受到非实验因素的干扰和影响的机会和数量基本相等。这样一来,由各组受试对象反映出来的实验效应才能的干扰和影响的机会和数量基本相等。这样一来,由各组受试对象反映出来的实验效应才能较为客观地体现出实验因素取不同水平时所产生的效果。较为客观地体现出实验因素取不同水平时所产生的效果。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅三、统计分析的意义三

54、、统计分析的意义:有些论文中的资料十分丰富,既有多因素又有多指标。遗憾的是有些作者未对资料作统计分析就作出了结论;有些虽然作了统计分析,但一般仅作单因素分析,并且,所选用的分析方法还不完全得当。由于统计软件日趋普及,人们可以利用科学的统计分析方法,对同一份资料进行更深入的的分析,这有助于更好地发掘资料中所蕴藏的信息,揭示资料间的相互关系和内在规律性。对于同一份实际资料,由于研究的目的、观察的角度不同,所选用的统计处理方法也会不尽相同。用多种统计分析方法对资料进行多层次、多侧面的综合处理,尽量挖掘各方面的信息是十分必要的,也是完全可能的。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅对资料作统

55、计分析时,可从以下几个方面考虑如何合理选择各种统计分析方法。其一,资料类型与描述统计量的选择。资料一般可分为定量与定性两大类,定量资料可细分为计量和计数两种;定性资料可细分为有序和无序(名义)两种。描述定量资料常用的统计指标有:平均指标、变异指标、分位数等;描述定性资料常用的统计指标有绝对数和相对数等。按变量测量的精确程度测量的精确程度由低到高,将数据分类为:名义数据(如性别、婚姻状况)、有序变量(如疗效,类别间差别大小难以度量)、区间变量(如摄氏体温,类别间差别有实际意义)、比变量(如身高,除具有区间变量的特征外,还具有真实意义的零点。摄氏温度的零点为水结冰时温度,并非绝对意义的零点,所以它

56、不属于比变量)浙江大学公共卫生学院流行病与卫生统计学科系 沈毅其二,资料类型与区间估计的选择。常用于定量资料的区间估计方法有个体值的容许区间(医学上亦称“正常值范围”)及总体均值(或其他特定参数)的可信区间;常用于定性资料的区间估计方法是总体率的可信区间。其三,资料类型与统计分析方法的选择。一般来说,当分组变量为定性变量,指标(或结果)变量为定量变量时,常用的统计分析方法有t检验、Z检验、方差分析(亦称F检验)和秩和检验等;当分组变量和指标(或结果)变量均为定性变量(包括由定量变量转化而产生的)时,常用的统计分析方法有卡方检验、秩和检验、Ridit分析、线性趋势检验等。其四,处理多因素多元资料

57、的常见统计分析方法有多元回归分析、多元方差和协方差分析、聚类分析、主成分分析、因子分析、典型相关分析等。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅四、资料统计分析中的错误四、资料统计分析中的错误:在对实际资料进行分析时,从统计分析的角度看,常见的错误是:对资料未作统计处理就下结论;多元(或多因素)的资料用一元(或单因素)统计分析方法处理,导致资料的利用率低,不能反映资料的整体情况,不能很好地揭示变量之间的交互作用和内在联系。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅当暴露变量为一个分类变量时,为单因素设计,常见的设计类型有单组设计、两组的成组设计和配对设计及多组的完全随机设计。若满

58、足参数检验条件,分别选用单样本t检验、成组两样本t检验、配对t检验及单因素多水平方差分析(one-wayANOVA);若不满足参数检验条件,分别选用ilcoxon秩和检验(或Mann-WhitneyU检验)、Wilcoxon符号秩和检验或Kruskal-WallisH检验。常见错误常见错误在做检验前,不对结局变量的分布和方差齐性进行检验,在不满足参数检验的前提条件下对定量资料盲目套用参数检验方法。错误举例错误举例某项研究评价治疗前后膝关节功能(表1),从结果来看,部分指标的标准差是均数的2倍,提示呈偏态分布,而原作者用单因素方差分析检验治疗前后的功能得分。正确做法是,选用非参数检验的办法,这个

59、研究是自身配对设计,可选用Wilcoxon符号秩和检验,或对结局变量进行变换,满足参数检验的要求。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅用Pearson卡方检验分析有序结局变量的数据?某项研究探讨原发性肝癌肝动脉碘油化疗栓塞(TACE)和三维适形放疗(3DCRT)综合治疗价值(见表5)。原文将不同水平的疗效进行了合并,采用Pearson卡方检验比较两组的有效率分别为71%和45%,P值为0.0097,这样合并没有充分利用资料的有序信息;而若用2C表卡方检验,P值为0.0827,没有考虑疗效的递减关系。所以,应选用CMH卡方检验行平均得分差的分析结果,P值为0.0160,(或用Ridi

60、t检验)才能做出正确的评价。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅重复测量的数据用单因素分析:某研究探讨重型颅脑创伤患者硫酸镁治疗与患者血清丙二醛(MDA)含量及预后关系。治疗组和对照组患者分别在入院时、用药后24、48和72小时抽取静脉血,检测MDA浓度(表3)。原文采用成组t检验在不同时间点进行两组比较,割裂了整体设计,没有考虑到对于同一观测对象,不同时间点上的数据是不独立的。该研究可选用重复测量设计的方差分析。对于较复杂的重复测量设计资料,可选择混合模型(Mixedmodel)或广义估计方程(GEE)等方法进行分析。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅不能充分利用数

61、据的信息,缺乏深入分析(浙江预防医学2012年第24卷第4期)男童行为因子均数比较(xs)女童行为因子均数比较(xs)作者分别对男童和女童的每项因子作了t检验,没有很好的利用数据中隐藏的分布信息,另外,多次重复t检验会增加I型错误的概率。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅对于这类数据可以考虑采用轮廓分析(ProfileAnalysis)方法:1、平行检验2、相合检验3、水平检验浙江大学公共卫生学院流行病与卫生统计学科系 沈毅笔误?统计学知识的缺乏?或杂志社审稿的错误?浙江大学公共卫生学院流行病与卫生统计学科系 沈毅五、多变量分析与单变量分析、多变量分析与单变量分析多变量分析是对多

62、变量分析是对m个反应变量进行一次假设检验(个反应变量进行一次假设检验(Hotelling T2检验或检验或MANOVA),对组间差别作出推断。在大多数情),对组间差别作出推断。在大多数情况下,多变量假设检验结论与对况下,多变量假设检验结论与对m个反应变量进行个反应变量进行m次单变次单变量假设检验(量假设检验(t检验或检验或ANOVA)的结论是一致的,即多变量)的结论是一致的,即多变量假设检验拒绝假设检验拒绝H0,m次单变量假设检验至少有一次拒绝次单变量假设检验至少有一次拒绝H0,SPSS、SAS等统计软件也是先给出多变量假设检验结果,等统计软件也是先给出多变量假设检验结果,再给出单变量假设检验

63、结果,作为多变量分析的补充。再给出单变量假设检验结果,作为多变量分析的补充。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅例例:某妇幼保健院将孕妇随机分两组,一组接受孕期保某妇幼保健院将孕妇随机分两组,一组接受孕期保健教育,另一组作为对照。健教育,另一组作为对照。表表14-3是同一日出生的是同一日出生的13名名顺产婴儿的体重和身长,问孕期保健教育对婴儿生长发顺产婴儿的体重和身长,问孕期保健教育对婴儿生长发育有无促进作用?育有无促进作用?表中用两个指标反映婴儿的生长发育状况,通过孕表中用两个指标反映婴儿的生长发育状况,通过孕期保健教育组和对照组婴儿样本均数比较,推论两组总期保健教育组和对照组婴

64、儿样本均数比较,推论两组总体均数体均数1和和2是否相等,进而得出孕期保健教育对婴儿是否相等,进而得出孕期保健教育对婴儿体格发育有无影响的结论。体格发育有无影响的结论。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅体重:体重:t=2.35,p=0.038 身高:身高:t=1.99,p=0.071浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 理论上单变量假设检验不能代替多变量假设检验,主要理由:理论上单变量假设检验不能代替多变量假设检验,主要理由:m次单变量假设检验增加假阳性错误的概率,设每次单变次单变量假设检验增加假阳性错误的概率,设每次单变量假设检验的检验水准定为量假设检验的检验水准定为

65、a,做完,做完m次检验次检验I类错误的概率增类错误的概率增加为加为am1-(1-a)m。单变量假设检验只说明某一变量在数轴分布上的组间差别,单变量假设检验只说明某一变量在数轴分布上的组间差别,不能反映多个变量在平面或空间上的差别,两者的意义不同,不能反映多个变量在平面或空间上的差别,两者的意义不同,各自说明各自的问题,不能相互代替。如表各自说明各自的问题,不能相互代替。如表14-8的两组数据,的两组数据,分别对两组新生儿出生时的体重与身长做单变量分别对两组新生儿出生时的体重与身长做单变量t检验:体重检验:体重t=2.35,p=0.038,身长,身长t=1.99,p=0.071,结论不明确。但,

66、结论不明确。但多变量的多变量的Hotelling T2检验:检验:T2=9.87,F=4.58,P=0.03,拒,拒绝绝H0:1=2,两组在平面分布上差别如图所示。,两组在平面分布上差别如图所示。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅二组的平面分布二组的平面分布浙江大学公共卫生学院流行病与卫生统计学科系 沈毅二组的空间分布二组的空间分布浙江大学公共卫生学院流行病与卫生统计学科系 沈毅六、充分利用现有的临床或体检数据1、描述性研究:临床或体检资料描述性研究包括体检人群的健康现况分布、疾病的筛检、生态学比较等。2、分析性研究:分析性研究可利用监测或体检数据所蕴藏的信息再分析研究,以提高研究证据的强度主要包括病例对照研究和队列研究。病例对照研究资料的特点是回顾性资料、产生偏倚的可能性较大。队列研究资料属前瞻性,没有回忆性偏倚,但存在失访偏倚,与病例对照研究相比偏倚较少。队列研究可直接估计危险度指标等。浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 图图1 1 病例对照研究原理示意图病例对照研究原理示意图调查方向:收集回方向:收集回顾性性资料料 比较比较 人数人数 暴露暴露 疾病疾

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!