医学科研设计的基本原则与统计分析方法

上传人:san****019 文档编号:16327864 上传时间:2020-09-26 格式:PPT 页数:75 大小:289.50KB
收藏 版权申诉 举报 下载
医学科研设计的基本原则与统计分析方法_第1页
第1页 / 共75页
医学科研设计的基本原则与统计分析方法_第2页
第2页 / 共75页
医学科研设计的基本原则与统计分析方法_第3页
第3页 / 共75页
资源描述:

《医学科研设计的基本原则与统计分析方法》由会员分享,可在线阅读,更多相关《医学科研设计的基本原则与统计分析方法(75页珍藏版)》请在装配图网上搜索。

1、科研设计的基本原则与统计分析的思维方法,暨南大学医学院,为什么要进行可科研设计?,医学科学研究的实验设计是医学科研中至关重要的一个环节。 一项好的实验设计 可以节约大量的人力、物力、财力和时间, 保证实验的科学性、可靠性和诚信度。,科研设计的一般要求,1科学性 能回答科研提出的问题。 2严密性 通过大量查阅文献和现场调查,搜集科学资料,或在进一步进行预备实验或可行性调查实验的基础上,进行严密的设计。,3合理性 能保证通过设计方案的实施,取得可靠的研究成果,具有普遍意义,经得住实践的考验。 4高效性 以最少的人力、财力、物力,得出有意义的结果。 5道德性 符合社会道德规范,决不损害人的身心健康。

2、,科研设计的基本原则,随机原则 对照原则 均衡原则 重复原则 盲法原则(临床试验时,可属均衡之列) 这些原则的作用是减少误差,提高实验效率。,对照原则,对照就是对受试对象不施加处理因素或施加处理因素前的一种处理状态 用于与施加处理因素或处理后状态进行比较,充分暴露处理因素的效应。,1对照的意义: 没有比较就没有鉴别,任何事物间的差异都是通过比较而显示出来的,比较的基准就是对照。 设置对照是为了更好的评价和鉴别实验结果的科学性、真实性,避免偏倚而产生错误的结论。,甄别处理因素与非处理因素效应,排除非处理因素干扰,减少实验误差 公式表达如下: T + S E + e 式中:T为处理因素,E为处理因

3、素效应,S为非处理因素,e为非处理因素效应。,对照的原理 T + S1 E + e1 0 + S2 0 + e2 T E,两个实验组相互比较的原理 T1 + S1 E1 + e1 T2 + S2 E2 + e2 如果 S1 = S2 , e1 = e2 那么 T1 - T2 E1 - E2 Td Ed,2对照的要求: 对等:除处理因素外,对照组要具备与实验组对等的非处理因素。 同步:对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。 专设:任何一个对照组都是为相应的实验组专门设立的。不得借用文献上记载或以往的结果或其他研究资料作为本研究对照。,3对照的形式 同期随机对照:相同

4、时间、地点选择研究对象,以随机分配方式分组;其可比性强,避免了选择性偏倚,结果更具说服力。 自身对照:对照与实验在同一受试对象进行。 历史性对照:将新的干预性措施的结果与过去的研究比较,即将研究者以往的研究结果或他人的研究结果与本次研究结果作对照。,非随机同期对照:研究对象是同时间、同地点,用非随机分配的方法分为实验组和对照组,分组的方法不是随机的。 配对对照:将实验组的观察对象按照配对因素与对照组相配对。 阳性对照:与已知疗效的典型药进行比较。 空白对照:对照组不施加任何处理因素。 实验对照(效应特异性对照):采用与实验组条件一致的对照措施。,随机化原则,随机化(randomization)

5、 指从总体中抽取个体或样本时,每个个体或样本都有同等被抽取的机会。 随机抽样 指各个个体或样本都有同等机会被抽取的抽样。,随机不同于通常意义的“随意”、“随便”两词 例如一个笼子里有10只小老鼠,要求均分到对照和试验组中去,如果研究者规定“短尾巴老鼠分到对照组、长尾巴老鼠分到实验组”就属于“随意”分组,包含有主观选择; 如果研究者规定“闭上眼睛捉老鼠,先捉住的作为对照组,后捉住的作为实验组”则属于“随便”分组,包含有客观选择。 因此随机抽样,可以理解为既没有主观选择、也没有客观选择的一种抽样方法。,随机化具体体现在如下几方面: 抽样随机: 每一个符合条件的实验对象参加实验的机会相同。 分组随机

6、: 每个实验对象分到处理组和对照组的机会相同,以保证各处理组间实验对象尽可能均衡一致,以提高各组间的可比性。 实验顺序随机: 每个实验对象接收处理先后的机会相同,以消除不平衡的实验顺序所产生的偏差。,随机化方法 1抽签法 例如要把12只动物分为两组,先将动物编号1、2、312,同时制作数字为112的标签,标签充分混匀后,按预先规定抽取6个签号,将动物对号入座分到第1组,余下的6个标签号的动物分第2组。 2随机数字表法 根据随机抽样的原理编制而成的,用于随机分配和随机抽样。 3Excel 编程,重复原则,重复(replication)有两层含意: 一是指实验的样本量必须足够大,在相同实验条件下充

7、分的重复,以避免实验结果的偶然性,突出表现其必然规律; 二是指任何实验结果的可靠世经得起重复实验的考验,重复实验是检查实验结果可靠性的惟一方法。 一个不可重复的研究是没有科学性的。,重复的目的有两个: 一是稳定标准差,获得实验误差估计值; 二可使均值接近真实值,实验组与对照组差异能够准确地显露出来。,样本大小的影响因素 1总体参数() 指两个样本均数或两个率比较时,其总体均数或率的差值。 越大,说明差异越明显,需要的样本量越小。 2实验误差 实验方法越准确,个体间差异越小,实验误差必然较小,越易达到统计等显著性,所需样本越小;否则,样本要大。,3检验水准 实验所需样本数与实验设计规定的检验水准

8、成反比,检验水准定得愈低,所需样本含量愈大,=0.01所需样本数大于=0.05所需样本数。 4检验效能(1一) 检验效能指当两总体确有差别时,按检验水准发现它们有显著差别的能力。 检验效能由 (第二类错误的概率)大小所决定,当=0.1,=0.2时,相应的检验效能为0.8和0.9。检验效能越大,所需要的时间样本量也越大。,5资料性质 同等情况下,数值变量资料所需样本量少于分类变量。 如果分类变量结果上相差悬殊,对照组全为阴性,实验组全为阳性,则少数样本也达到统计学的显著性。 6实验结果的可能性 双向结果(存在AB或AB两种可能性)所需样本数多 单向结果(只存在AB或AB一种可能性)所需样本数少。

9、 7实验设计的类型 完全随机实验设计所需样本多 配对设计随机区组实验设计所需样本较少 拉丁方实验设计所需样本更少 序贯实验设计所需样本数又可少3050,样本大小的估计方法 样本含量越大或重复次数越多,越能反应变异的客观真实情况。 若样本含量过大,浪费人力物力。 若样本含量过小,有专业意义的差异,也可能没有统计学意义,造成假阴性错误。,粗估法 动物实验时 大动物(犬、猫)515只组; 中等动物(兔、豚鼠1020只组; 小动物(大鼠、小鼠)1530只组。 临床研究一般难治愈的疾病 疗效显著时(如癌症)510例即可; 急重病死亡率高的(如休克、心衰、肾衰、呼吸衰竭)需3050例; 一般病和慢性病30

10、0500例; 按WHO规定 血清流行病学调查需300600例, 一般流行病学调查和正常值调查则常需千例以上。 恶性肿瘤的流行病学调查至少10万人口以上; 多因素分析时,样本含量数是研究因素数的510倍以上。,计算法 见样本含量的计算 (Excel程序),均衡性原则,均衡(balance) 即实验组和对照组或各实验组之间,除了观察的受试因素外,其他一切条件应尽可能相同或一致 如动物的种属、品系、窝别、年龄、性别、体重、健康状况、生理条件、饲养环境等要保持一致。 如果受试对象是病人,则要求病人的病种、病期、病型、病程、年龄、性别、生活、社会、心理等因素保持均衡一致。 均衡的意义 在于更好地避免偏性

11、,减少误差,提高实验的精确性。,均衡的方法 1交叉均衡法 2分层均衡法,均衡性检查,先按主要影响因素分层,然后在层内随机抽样,这样组间均衡性较好。 但若样本分配并不是采用分层随机,而是使用完全随机的方法,在小样本实验中则可能出现严重不平衡状态。 为弥补这一缺陷,应在实验样本数达到预定数8090时进行均衡性检查。若发现不平衡指数(影响因素差数绝对值之和,di )较大时,随后的样本分配应以如何使不平衡指数减小为原则。,例如,比较复方青黛与马利兰对慢性粒细胞白血病的疗效,预定观察20例,每组10例,按完全随机已收治17例。若性别、年龄、病情与病程是其主要影响因素,则按此进行均衡性检查。,di=12

12、检查结果不平衡指数di )较大,故随后继续进来的病例应当以使di减少为原则。 如新来一位符合受试条件的本病患者系男性青年,病情较重,确诊已达1年半。 若将此患者分至马利兰组,则di 增至16, 若将其分至复方青黛组,则di 减至8,故应将此患者分至复方青黛组。,盲法原则,盲法(blindness) 是指按试验方案的规定,不让参与研究的受试者和(或)观察者、其他有关工作人员(部分设计者)知道病人所接受的是何种处理(试验药或对照药),从而避免他们对试验结果的人为干扰和心理因素的影响。,单盲法(single blindness),单盲法:在研究中,受试对象不知道接受什么处理。 单盲法的优点: 避免研

13、究对象的主观因素所致的偏差。 单盲还保留非盲法的优点,即实施起来容易,在研究对象出现任何变化时,担任观察任务的研究人员容易判断其原因,并决定是否终止试验或改变方案,以保证处理因素使用的安全性。 单盲法的缺点: 不能避免研究人员主观因素所产生的偏倚, 单盲获得结论的客观性和可信度低于双盲法。 用于单盲的对照药物既可是安慰剂,也可以是有效药物或标准治疗。,双盲法(double blindness):研究中,受试者和承担观察任务的研究人员均不知道每个受试对象的分组和接受处理的情况 可避免受试对象的主观偏差和研究者的人为偏差。,需要用双盲临床试验,在临床研究中 反映疗效和安全性的主要指标如果是主观、定

14、性的,或者虽是定量指标,但容易受心理、精神因素影响的。 新的新药评审办法 化学药品第一、二、三类药物; 五类药物中需延长用药周期和(或)降低剂量的药物要进行期临床实验的。,双盲法较为复杂,实际执行起来困难较大。 在研究过程中,由于种种原因容易造成盲底泄露,称为破盲。 在执行双盲法时,如果病情发生变化,不能准确判断并及时处理。,双盲法临床试验注意的问题:,(1)严格随机分组,认真、客观填写病例报告表。 (2)实验组与对照组所用的药物外观、形状、剂型等必须高度一致。 (3)要有一套完善的执行盲法编码制度,受试对象的所有记录、请求单、回报单等全采用代号制。,(4)每个盲法试验应指定一位第三者作为统筹

15、负责和监督整个研究工作的监视员。 其职责是监督盲法执行,保证结果的可靠性,保证受试对象的安全,分发应急信件,保管盲底,试验终末揭盲等。,(5)设有应急信件和紧急情况个别病例揭盲规定。 临床试验必须符合科学和道德伦理原则:为防止试验中出现紧急情况贻误病人治疗,应为每一个编盲号设置一个应急信件(内容为病例用药编号、药名),以便在紧急情况对个别病例揭盲抢救治疗。,(6)盲态核查 指最后一例受试者的最后一次观察完成后,数据管理员将病历报告表输入数据库,并经过复核、直到数据锁定,以及第一次揭盲间对数据的核查和评价等所做的工作。 是双盲临床实验中标准操作规范中的一个必要环节,必须严格实施。,三盲法(tri

16、ple blindness),三盲法是双盲法的扩展,即受试对象、研究人员和资料分析人员均不知道受试对象的分组和管理情况。 理论上可以减少资料分析上的偏差 分析时减弱了对整个研究工作的全局了解,对研究的安全性要求较高,在执行时也较严密,难度较大。,统计分析的思维方法,统计学中的几个基本概念,1、总体与样本 总体(population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 根据总体所含有观察单位的个数是否可以清点数目,分为有限总体(finite population)和无限总体(infinite population)。 在实际工作中,对于无限

17、总体或有限总体多采用随机化抽样进行研究,目的是通过样本信息推断总体特征。 按照随机化抽样原则,从总体中抽取的部分观察单位的某变量值的集合称为样本(sample),这时的样本对总体具有较好的代表性。,样本(sample)是按照随机化抽样原则,从总体中抽取的部分观察单位的某变量值的集合 这时的样本对总体具有较好的代表性。 样本所包含的个体数量,称为样本含量(sample size),用符号n表示。 如上例,在2006年某地正常成年男子中随机抽取120人,这120人的身高值即为样本。120为样本例数(即n120)。,2、变量 观察单位的某项特征指标称为变量(variable), 对变量的测量值称为变

18、量值(value of variable)或观察值(observed value),用符号x表示,一群变量值构成一组资料(data)。 例如,以人为观察单位,调查某地某年1岁男童的身体发育状况,身高、体重等都属于变量。,按变量值是定量的还是定性的,可将变量分为以下类型。 (1) 数值变量 数值变量(numerical variable)或称定量变量,是通过仪器设备测量出来的,其变量值是定量的,表现有量的大小、值的高低,通常具有度量衡单位。 如人的体温()、呼吸(次min)、体重(kg)、血压(kPa)等。,(2) 分类变量 分类变量(categorical variable)或称定性变量,是通

19、过清点数目得到的,其变量值是定性的,表现为互不相容的类别或属性的个数多少。,根据类别之间是否有程度上的差别又分为: a、无序分类变量 各类别之间有性质上的不同,而无程度上的差别。 b、有序分类变量 相对独立、自成一组,但组间排列有序、存在程度上的差别 比如观察某人群成年男子的血红蛋白含量,按血红蛋白含量的多少可分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高; 又如观察用某药治疗某病患者的疗效,以每名患者为观察单位,临床疗效分为治愈、显效、好转、无效四级。,(3) 变量间的转化 根据研究分析的需要,在一定条件下各类变量之间可以相互转化。 如人的血压属数值变量,当分析需要时可转化成

20、无序分类变量(血压正常与异常)和有序分类变量(低血压、正常血压、高血压)。 有时还可以将分类变量数量化,如无序分类的性别(女、男)可转为0、1;有序分类的血压等级 (低血压、正常血压、高血压)分别转成1、2、3。,3、同质与变异 同质(homogeneity)是指研究事物具有相同或相近的性质、条件或影响因素。 客观上,完全同质是做不到或难以做到的,所以统计学中的同质是指对观察指标影响较大的、且可以控制的主要因素的相同, 如研究某药物对肺结核病的治疗效果,要求结核病人被确诊,其病情、病程、年龄、性别相同或相似,等等;,变异(variation)是指同质基础上的个体间的差异。 个体差异主要来源于一

21、些已知的或未知的,甚至是某些不可控制的因素所导致的随机误差。 如将对身高影响较大的因素控制在相同条件下,测试一批大学生身高,每个人的测得值并不完全相同,这种差异称为身高的变异。 统计研究的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征与规律。,4、参数与统计量 参数(parameter)是通过总体的所有变量值计算的描述总体特征的指标 用希腊字母代表,如:总体均数、总体率、总体标准差等。 统计量(statistic)是根据样本的变量值计算的描述样本特征的指标, 用拉丁字母代表,如:样本均数、样本率p、样本标准差S等。,前述某地2006年所有正常成年男子身高

22、值的均数为参数,120人的样本均数为统计量。 对于一个总体来说,总体的参数是固定、唯一的,而来自同一总体的不同样本的统计量是有差别的。,5、随机化,6、误差 误差(error)泛指测量值与真实值之差 根据其产生的原因和性质 随机误差(random error) 非随机误差(nonrandom error),随机误差是由许多无法控制的因素引起的一类不恒定的误差。 包括随机测量误差、抽样误差。 随机测量误差指在同一条件下对同一对象进行测量,虽极力控制或消除系统误差,测量结果之间仍然存在差别,呈随机的变化; 抽样误差是由于抽样而使获得的样本统计量与总体参数之间存在差别。 随机误差的特点: 随机误差是

23、不可避免的,因为无法控制引起随机误差的因素。 随机误差呈正态分布,可以用统计学的方法加以分析。,非随机误差分为 系统误差是一类恒定,由可知或可控制的因素引起的误差。如测量仪器未经校准就进行测量,使测量结果一致的偏大或偏小。 系统误差可以通过周密的设计和要严格的技术措施加以消除或控制。 非系统误差又称过失误差,是由于研究者的偶然过失而造成的误差。如差错数字,点错小数点等。 这类误差应通过认真核查加以消除。,7、抽样误差 抽样误差(sampling error)是指由于随机抽样的原因引起的样本指标(统计量)与总体指标(参数)之间差别,或从同一总体抽取的不同样本指标之间的差别。 根本原因是由于总体中

24、的个体间存在变异 因为生物个体之间的差异总是客观存在,所以抽样误差不可避免,但大小有规律可循。,8、概率 概率(probability)又称为几率或或然率,以符号P表示,是反映某一事件发生的可能性大小的量, P越接近1表示该事件发生的可能性越大, P越接近0表示该事件发生的可能性越小。 其取值范围在0到1之间,可以用小数或百分数表示。,9、随机事件、必然事件、不可能事件 随机事件有广义随机事件和狭义随机事件之分。 广义随机事件是指概率值在0和1之间,包括0和1的事件。 其中P1的事件称为必然事件; P0事件称为不可能事件。 所以,P1和P0可看成是广义随机事件的特例。 狭义随机事件指概率值在0

25、和1之间,不包括0和1的事件,即不包括必然事件和不可能事件。,10、小概率事件 习惯上,把P 0.05或P 0.01的事件称为小概率事件。 这就是为什么通常把P0.05或P0.01作为划分事物差异是否具有统计学意义界限的理论依据。,4、假设检验的基本思想(思维方法) 小概率事件的反证法,小概率事件实际不可能发生原理: 小概率事件(P0.01或P0.05)在一次试验中实际上是不可能发生的。 反证法思想: 先提出无效假设H0(备择假设H1 ),再用适当的统计方法确定H0成立的概率P。如果P小,则拒绝H0成立,承认 H1成立;若P不小,则没有理由拒绝H0成立, 即接受H0,拒绝H1。,比喻:公安局办

26、理一起 “盗窃案”,一起高层居民楼发生盗窃案 最后怀疑张三、李四两人 由于张三是惯偷,先假定是张三所为 调查证据和分析: 盗窃案发生在10楼 攀墙、越窗进入 张三是瘸子 所以,张三盗窃的可能性很小( P0.01或P0.05 ) 结论:不是张三干的,是李四所为!,假设检验是如此“办案”的,一起样本均数与总体均数比较的假设检验 已经确定差别由抽样误差或本质差异引起 抽样误差经常存在,先假定是抽样误差H0所致 计算由抽样误差所致的统计量(如 t -值、F -值、2 -值)和概率 结论:拒绝H0,接受H1,认为存在本质差异!,根据研究目的,提出假设 无效假设H0 :抽样误差所致 备择假设H1:本质差异

27、造成 确定显著性水准 (=0.05 or 0.01) 计算统计量(如 t -值、F -值、2 -值),确定P值 作出结论 P,拒绝H0、接受H1;否则,接受H0 、拒绝H1,假设检验的基本步骤,统计资料的类型 统计资料按其性质一般分为 计数资料 计量资料 等级资料 不同类型的统计资料应采用不同的统计分析方法。,1、计数资料(measurement data)是先将观察单位按某种属性或类别分成相互独立的若干组,再清点各组观察单位个数所得到的资料。 如对一批某病患者检验完毕后,清点呈阳性或阴性反应的人数。又如调查某人群的血型分布,先按A、B、AB、O四型分组,再清点各血型组的例数。 计数资料所对应

28、的测量指标称为分类变量,所以计数资料也称为分类变量资料, 相对于后述的有序分类变量资料而言,此类资料一般指的是无序分类变量资料,可计算百分比或率等相对数,需要时做百分比或率之间的比较,也可做两事物之间相关的相关分析。,2、计量资料(enumeration data)是用测量仪器或其它定量方法对每个观察单位的某项指标进行测定所得到的一组数值,一般带有度量衡单位。 如检查某地青少年的体重,需要体重计称量,以公斤等为单位,测得大小不一的体重值。其它如身长(cm)、血压(mmHg)、脉搏(次分)、红细胞(万/mm3)、转氨酶(单位)等,都属于计量资料。 计量资料所对应的测量指标称为数值变量,所以计量资

29、料也称为数值变量资料,可计算平均数与标准差等指标,需要时做各均数之间的比较或各变量之间的分析。,3、等级资料(ranked data)又称半定量资料,是将观察单位按某种属性或某个特征的等级顺序分组,然后清点各组观察单位的个数得来的资料。 这些资料既具有计数资料的特点,又兼有半定量的性质, 例如对一批急性病毒性肝炎患者作麝香草酚絮状试验,将试验结果按浑浊程度分为-、+、+、+、+几组,显然各组之间既有等级程度差异,又有个数多少的差别。 又如某病住院病人的治疗结果,按治愈、好转、无效、死亡分组,同样各组之间具有程度与数量之别。,等级资料所对应的测量指标称为有序分类变量,所以等级资料也称为有序分类变量资料 分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、Ridit分析等。,根据分组的多少、组与组之间有无等级程度的差异将资料分为: 二项无序资料、 二项有序资料、 多项无序资料、 多项有序资料, 甚至相互交叉组成更为复杂的类型资料,如二项无序二项无序的资料、二项无序多项有序的资料等等。 总之,根据不同的分析要求对统计资料可有不同的分类方法。,统计分析 统计描述 统计推断 见Excel统计分析教程,有关统计学假设检验方法的正确抉择,The end,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!