数据处理newPPT课件

上传人:英*** 文档编号:77618956 上传时间:2022-04-20 格式:PPTX 页数:117 大小:807.37KB
收藏 版权申诉 举报 下载
数据处理newPPT课件_第1页
第1页 / 共117页
数据处理newPPT课件_第2页
第2页 / 共117页
数据处理newPPT课件_第3页
第3页 / 共117页
资源描述:

《数据处理newPPT课件》由会员分享,可在线阅读,更多相关《数据处理newPPT课件(117页珍藏版)》请在装配图网上搜索。

1、新药研究新药研究主要药效研究主要药效研究a) 两种方法以上,包括整体实验或动物模型实两种方法以上,包括整体实验或动物模型实验验b) 指标明确,客观,定量指标明确,客观,定量c) 量效关系量效关系d) 对照(空白对照,阳性对照(空白对照,阳性e) 给药途径与临床用药途径一致给药途径与临床用药途径一致一般药理研究一般药理研究第1页/共117页新药筛选a)筛选:微量筛选:微量迅速,准确迅速,准确b)方法(用量少)方法(用量少)c)尽量小动物尽量小动物d)能腹腔给药能腹腔给药e)尽量降低整体水平,多采用离体,亚细胞水平,生化实验尽量降低整体水平,多采用离体,亚细胞水平,生化实验第2页/共117页 实验

2、动物的选择:实验动物的选择: 种属差异种属差异 品系差异品系差异 性别差异性别差异第3页/共117页实验水平(机体水平):实验水平(机体水平): 整体水平:清醒整体水平:清醒 麻醉麻醉 离体离体第4页/共117页动物模型:动物模型: 正常动物模型正常动物模型 病态模型:急性,慢性病态模型:急性,慢性 手术模型,物理方法形成,手术模型,物理方法形成, 药物诱发,遗传自发药物诱发,遗传自发第5页/共117页 根据在模型形成前或后给药治疗的方式可分为预防实验和治疗实验根据在模型形成前或后给药治疗的方式可分为预防实验和治疗实验 预防实验:抗炎,预防实验:抗炎, 治疗实验:镇痛,治疗实验:镇痛,第6页/

3、共117页 药物作用强度药物作用强度 剂量依赖性剂量依赖性 量效关系量效关系 药物作用时间药物作用时间:起效时间,持续时间,作用最大时间起效时间,持续时间,作用最大时间第7页/共117页 药效评价标准:药效评价标准: 药物评价的定量方法药物评价的定量方法 量效关系量效关系 时效关系时效关系 构效关系(构效关系(QSAR)QSAR) 靶效关系靶效关系第8页/共117页 药物作用强度药物作用强度 剂量依赖性剂量依赖性 量效关系量效关系 药物作用时间药物作用时间:起效时间,持续时间,作用最大时间起效时间,持续时间,作用最大时间第9页/共117页变变 量量( (variable)variable) 变

4、量值(变量值(value)/value)/观察值(观察值(observed observed value)value) 资料(资料(data)data) 数值变量(数值变量(定量定量变量变量, ,计量变量计量变量, ,定量资料)定量资料) 每个观察单位指标用具体数值表示每个观察单位指标用具体数值表示 ( (度量度量衡单位和小数衡单位和小数) ) 分类变量(分类变量(定性定性变量变量无序分类(无序分类(计数计数资料)资料)1 1)二项分类)二项分类( (阴阴, ,阳阳 2 2)多项分类)多项分类有序分类(有序分类(半定量半定量,等级资料),等级资料)第10页/共117页误差(误差(errorer

5、ror)观察值与真实值之差以及样本指标与总体观察值与真实值之差以及样本指标与总体指标之差(除抽样误差,其他指标之差(除抽样误差,其他/ /系统误差称偏因,系统误差称偏因,偏倚偏倚bias)bias) 系统误差系统误差 随机误差(抽样误差)随机误差(抽样误差) 过失误差过失误差(gross error) 设计错误,操作不当,记录错误设计错误,操作不当,记录错误 第11页/共117页系统误差系统误差(systematic error)误差值固定不变或有规律误差值固定不变或有规律原因:原因: 仪器(校正,疲劳)仪器(校正,疲劳) 方法差异(放免,方法差异(放免,Elisa) 试剂差异(分析纯)试剂差

6、异(分析纯) 条件差异条件差异(屏蔽屏蔽) 顺序差异(加样)顺序差异(加样)第12页/共117页随机误差(随机误差(random errorrandom error) 不固定,随机变化,正态分布不固定,随机变化,正态分布 不可避免由多种无法控制因素引起。不可避免由多种无法控制因素引起。 统计上的误差指随机误差,包括抽样误差与重复测量误差,一般指统计上的误差指随机误差,包括抽样误差与重复测量误差,一般指抽样误差抽样误差。统计检验目的是回答差异来。统计检验目的是回答差异来自抽样误差的自抽样误差的概率概率。 最重要,常见最重要,常见第13页/共117页抽样误差抽样误差 Sampling Error原

7、因:原因:1)研究结果必须用于总体()研究结果必须用于总体(Population)研究对象(研究对象(Sample)永远是群体的一部分永远是群体的一部分样本能否代表(样本能否代表(Representativeness)群体群体 ?无法?无法避免避免2)个体差异)个体差异解决方法:解决方法: 重复(适当的样本量重复(适当的样本量 Sample size.)第14页/共117页医学研究的主要误差ErrorsErrors 抽样误差抽样误差 Sampling Error 非均匀性误差非均匀性误差 Heterogeneity error,非齐性误差,内部不均匀所致。非齐性误差,内部不均匀所致。 分配误差

8、分配误差 Allocation error :不能主观不能主观,应随机应随机 条件误差条件误差 Condition error : 条件要恒定条件要恒定 顺序误差顺序误差 Sequence error : 固定顺序易出错固定顺序易出错第15页/共117页 如材料较均匀(假定年龄,性别不影响)-抽样误差(确定样本量 不均匀(年龄,性别等影响,如大学生,增加样本无法克服)第16页/共117页非均匀性误差非均匀性误差 Heterogeneity error, 非齐性误差非齐性误差 多组中,组内结构不均匀多组中,组内结构不均匀如:组内妇女多,小孩多,如:组内妇女多,小孩多, 老年比率高老年比率高 解决

9、方法:解决方法: 分层随机化分层随机化 Stratified Randomization : 先按一定的指标分成多种层次先按一定的指标分成多种层次 Strata : 如不同年龄层次;每个层次内个体随机分如不同年龄层次;每个层次内个体随机分配到各组内;这样可以保证各组内结构非常接近。配到各组内;这样可以保证各组内结构非常接近。第17页/共117页分配误差分配误差 Allocation error 分配应该屏除一切主观愿望;分配应该屏除一切主观愿望;研究者主观愿望希望成功;研究者主观愿望希望成功;病人希望疾病治愈;病人希望疾病治愈;不能让研究者或病人知道分配内容:不能让研究者或病人知道分配内容:

10、双盲法双盲法 Double blind method 随机化分配随机化分配 :Randomized allocation第18页/共117页条件误差:条件误差:Condition errorCondition error 原因;原因; 条件变化条件变化 维持条件恒定是科学研究的核心维持条件恒定是科学研究的核心 随机化随机化 对照对照 第19页/共117页Compliance BiasCompliance Bias顺应性误差顺应性误差 病人不合作;病人不合作; 病人没有按照医生指示服药;病人没有按照医生指示服药; 病人没有说真话。病人没有说真话。 改善医生病人关系;改善医生病人关系; 护士病人关

11、系;护士病人关系; 建立医务人员和病家良好关系;建立医务人员和病家良好关系; 相互信任;相互信任; 改进剂型改进剂型第20页/共117页其他:其他: 向均值回归误差(向均值回归误差(Regression to the mean bias)Regression to the mean bias) 评估误差评估误差 ( (Error of Assessment)Error of Assessment) 研究者评估结果带来偏差(研究者评估结果带来偏差(主观剔除主观剔除 ExclusionsExclusions 采用双盲法,安慰剂采用双盲法,安慰剂 PlaceboPlacebo 发表误差发表误差 Pu

12、blication bias : Publication bias : 报喜不报忧报喜不报忧第21页/共117页统计描述计量资料: 平 均 值 标 准 差(x s): 标 准 差: 离 散 指 标, 不 随 样 本 大 小改 变 标 准 误(SE):SE2S2/n 样本均数 对总体均数离散程度 变异系数(CV): : S/x 波动程度, , 60%:非正态分布 第22页/共117页SD 是生物特异参数,与是生物特异参数,与N无关无关; ; SE 与与N成反比。成反比。N=43平均值平均值SDCVSEF40.51410.51410.28250.282554.950454.95040.021540

13、.02154F60.50310.50310.28160.281655.97355.9730.017530.01753F80.49830.49830.28830.288357.856757.85670.015540.01554F200.50430.50430.28010.280155.542355.54230.009550.00955F500.5040.5040.28370.283756.289756.28970.006120.00612F1001000.49460.49460.28620.286257.864957.86490.004360.00436F2002000.48980.48980.

14、28860.288658.92258.9220.003110.00311F5005000.4920.4920.29420.294259.796759.79670.002010.00201F100010000.49550.49550.29320.293259.172659.17260.001410.00141F20000.49630.49630.29310.293159.05759.0570.0010.001理论值理论值0.50.50.28870.288757.7457.74第23页/共117页 CV 是科研工作中最受人注意的参数。 CV 反映 SD 和平均值的关系。 随机数的理论CV是: 0.

15、288/0.5 100%=57.6% 变异系数60%不是正态分布了。第24页/共117页计量资料统计描述 偏态作为正态 Exp:Exp:“0.142 0.142 0.1500.150”, ,标准差大于平均数,呈偏态分布的, ,不适合用正态分布法来表达, ,应该选用中位数描述集中趋势。 标准差与标准误混用第25页/共117页标准差标准误第26页/共117页量反应资料的数据检查可疑数据的取舍: 在均值2.6标准差内(P0.3),保留 均值2.6标准差均值4标准差,考虑 在均值4标准差外,舍去第27页/共117页定性变量统计描述分类资料:相对数 强度相对数(率,rate):某现象发生的频率或强度(百

16、分率) 结构相对数(构成比):各构成部分在总体中所占的比例(总和为100% ) 相对比 (比):两指标的比例关系第28页/共117页分类资料 相对数注意问题:1)率分母不宜过少(不稳定)( 40),以绝对值表示第29页/共117页2)相对数概念不清,勿将构成比视为率 第30页/共117页科室科室病人数病人数死亡人数死亡人数死亡构成死亡构成死亡率死亡率内科内科3502530.8671.43外科外科6503037.0446.15肿瘤科肿瘤科1202024.69166.67妇产科妇产科30056.1716.67皮肤科皮肤科56000眼科眼科45000小儿科小儿科10011.2410.00合计合计16

17、2181100.0049.97第31页/共117页表115例恶性血液病合并深部真菌感染患儿的主要临床表现临床表现临床表现 n 构成比构成比(%)发热发热 15 100全身中毒症状全身中毒症状 10 67口腔病损口腔病损 13 87呼吸系统症状呼吸系统症状 9 60消化系统症状消化系统症状 7 47肝脾肿大肝脾肿大 5 33血性心包积液血性心包积液 1 7误将发病率作为构成比误将发病率作为构成比第32页/共117页放环放环放环放环人数人数失败失败人数人数失败人数比失败人数比(构成比(构成比(%)失败率失败率人工流人工流产产2557861.9(78/126)30.6(78/255)月经后月经后87

18、3931.044.8哺乳期哺乳期1797.152.9合计合计35912610035.1(126/359)注意:1)构成比高,因为流产后放环人数多 2)合计率的计算第33页/共117页 注意资料的可比性 注意率的标准化 第34页/共117页甲法乙法病人病人数数治愈治愈数数治愈治愈率率病人病人数数治愈治愈数数治愈治愈率率普通300180601006565重型100353530012541.7合计40021553.840019047.53)内部构成不同,需标准化甲比乙治愈率高?第35页/共117页甲甲乙乙原治原治愈率愈率预期治愈预期治愈数数原治愈原治愈率率预期治愈预期治愈数数普通普通 4006024

19、065260重型重型 4003514041.7167合计合计 800380(47.5%)427(53.4%)标准化直接法第36页/共117页定量数据的标化定量数据的标化不同中心的参考值范围(reference range)不同,需要适当的标化(standardization) 标化法1)标准差标化法(指标分布近似对称/正态)(原始观察值-中心实验室的参考均数)/标准差第37页/共117页第38页/共117页第39页/共117页对照组治疗前后差异无统计学意义(t = 1.2546, P = 0.2302);试验组治疗前后差异亦无统计学意义(t = 0.4866, P = 0.6341)第40页/

20、共117页标化法标化法 均数倍数标化法或中位数倍数标化法 只提供中心均数或中位数,需计算均数倍数(multiple of the mean)或中位数倍数(multiple of the median) 参考值范围标化法第41页/共117页数据描述与表达的错误1)同一指标小数点位数应该一致,用0 补齐2)有效数字 不算前零算后零,与小数点位置无关。 一般药理实验取34位 尾数四舍六入,逢五化偶(前为偶,舍;奇,进) 根据1/3标准差的第一位有效数取舍:Exp:12.3667 2.28 12.4 2.3 加减或乘除的有效位数原值第42页/共117页统计表绘制和表达错误统计表绘制和表达错误 结构不规

21、范结构不规范: : 表格无标题、标目表格无标题、标目,结构混乱结构混乱,线条太多线条太多 主谓倒置主谓倒置: : 被研究者被研究者( (主主) )置纵标置纵标( (表左表左););各项指标各项指标( (谓谓) )置横标置横标( (表右表右) ) 排列逻辑性差排列逻辑性差: : 一般先排绝对数一般先排绝对数,再排相对数或平均数再排相对数或平均数; ;对比关联事项尽量归类和靠近排列。对比关联事项尽量归类和靠近排列。第43页/共117页SD?正态分布主谓倒置第44页/共117页第45页/共117页(1) 表中数据含义未表达清楚表中数据含义未表达清楚 “%” (2) 舌侧楔缺义齿基牙患病比例和非义齿基

22、牙患病比例相加为舌侧楔缺义齿基牙患病比例和非义齿基牙患病比例相加为99. 3 %(属于计算错误所致属于计算错误所致) (3) 纵、横标目位置放颠倒。纵、横标目位置放颠倒。(4)线条太多线条太多第46页/共117页第47页/共117页数据描述与表达的错误:复式条图割裂连续性变量“浓度” 间的连续性;复式条图适合一个统计指标,两个分组因素的资料;第48页/共117页 96 96 篇研究生学位论文统计方法误用统计篇研究生学位论文统计方法误用统计 误用类别误用类别 使用次数使用次数 误用数误用数 误用比例误用比例(% ) 描述描述 92 12 13. 0 t 检验检验 50 16 32. 0 方差分析

23、方差分析 40 10 25. 0 X2 检验检验 32 4 12. 5 统计图统计图 28 8 28. 6 419 419 篇临床论著篇临床论著(1994-1995):(1994-1995):t t检验误用率检验误用率50%50%第49页/共117页 1908,W.S.Goset 以笔名“student”提出著名的t分布 t分布:以0为中心的对称分布,自由度越大,接近正态分布 单侧概率为一侧尾部面积;双侧概率为两侧尾部面积之和。 单侧检验临界值双侧检验的临界值第50页/共117页t 检验的适用范围与前提条件检验的适用范围与前提条件 单因素两水平设计( (配对; ;成组设计) )和单组设计( (

24、一组数据和一个标准值) )的定量资料的均值检验。 服从或近似服从正态性 ( (配对设计要求资料的差值) ;) ;成组设计资料还应满足方差齐性( (各样本的总体方差相等) )第51页/共117页t检验1)Excel: f(x)-统计-ttest-P; TTEST(B3:B6,C3:C6,2,2) tail:1(单);2(双) type:1:配对,2:成组, 3:异 t=TINV(P,DF)2) Excel: add in-P;工具,数据分析 t=TINV(P,DF)第52页/共117页t检验3) input formula: t P=tdist(t,DF,2)4) t*t=F第53页/共117页

25、test groupcontrol group28.7347.1139.5843.8345.1441.1236.1439.7432.7941.9632.147.3747.5643.5253.7447.9355.932.8130.8544.4方差齐性检验F-检验 双样本方差分析test groupcontrol group平均40.25342.979方差96.0818011120.25427667观测值1010df99F4.743778447P(F=f) 单尾 0.014888940.01488894F 单尾临界3.178897146两样本方差不等两样本方差相等第54页/共117页t-检验: 双

26、样本异方差假设变量 1变量 2平均40.25342.979方差96.0818011120.25427667观测值1010假设平均差0df13t Stat-0.7992242-0.7992242P(T=t) 单尾 0.219259879t 单尾临界1.770931704P(T=t) 双尾 0.438519757t 双尾临界2.16036824t=0.7992t-检验: 双样本等方差假设变量 1变量 2平均40.25342.979方差96.08180111 20.25428观测值1010合并方差58.16803889假设平均差0df18t Stat-0.799224231P(T=t) 单尾0.21

27、7290339t 单尾临界1.734063062P(TF0.01(5,24)第69页/共117页外膜缝合外膜缝合 束膜缝合束膜缝合1月月10101010101020204040303050505050101030302月月3030505030305050707070706060606030303030方差分析:可重复双因素分析方差分析:可重复双因素分析差异源差异源SSSSdfdfMSMSF FP-valueP-valueF critF crit时间时间242024201 1242024208.066678.06667 0.011820.011824.4944.494缝合方法缝合方法180180

28、1 11801800.60.60.449870.449874.4944.494交互交互20201 120200.066670.06667 0.799550.799554.4944.494内部内部480048001616300300总计总计742074201919析因设计的方差分析第70页/共117页定性资料 每个观察单位上的指标反映某一方面的性质每个观察单位上的指标反映某一方面的性质,并不能用具体的数值表示。又分为名义资料和有序资料。并不能用具体的数值表示。又分为名义资料和有序资料。 列联表有二维列联表和高维列联表。列联表有二维列联表和高维列联表。第71页/共117页淋巴上皮淋巴上皮未分化未分

29、化 鳞癌鳞癌其他其他南方南方71716 616161818东北东北8989181822225151分类比的比较治愈治愈未愈未愈替硝唑替硝唑25254 4甲硝唑甲硝唑18181414样本反应率的比较第72页/共117页X2检验(chi square test) 用途:检验两个或多个率或构成比之间差别是否有显著性,推断其总体率或构成比是否相同 基本思想:检验实际频数和理论频数的差别是否由抽样误差引起理论频数nrnC/N第73页/共117页controltreated有效有效5 5143143148148无效无效5 5474752521010190190200200P=0.075870.07587卡

30、方值卡方值= 3.151323.15132controltreated有效有效1010135135145145无效无效1010454555552020180180200200P=0.017530.01753卡方值卡方值=5.64265.6426controltreated有效有效50507575125125无效无效505025257575100100100100200200P=0.000260.00026卡方值卡方值= 13.334913.3349第74页/共117页controltreated有效有效50506666116116无效无效5050343484841001001001002002

31、00P=0.021890.02189卡方值卡方值= 5.254535.25453controltreated有效有效50508080130130无效无效505020207070100100100100200200P=8.7E-068.7E-06卡方值卡方值= 19.732919.7329controltreated有效有效50506464114114无效无效505036368686100100100100200200P=0.045540.04554卡方值卡方值= 3.998363.99836第75页/共117页controltreated有效有效100100110110210210无效无效10

32、01009090190190200200200200400400P=0.316710.31671卡方值卡方值= 1.002511.00251controltreated有效有效50505555105105无效无效505045459595100100100100200200P=0.478950.47895卡方值卡方值= 0.501250.50125第76页/共117页controltreated有效有效80809696176176无效无效20204 42424100100100100200200P=0.00050.0005卡方值卡方值=12.12112.121controltreated有效有效

33、50506666116116无效无效505034348484100100100100200200P=P=0.021570.02157卡方值=卡方值= 5.280275.28027第77页/共117页影响卡方大小因素 分配比不同(分配比相等时效率高) 有效率不同 总数不同 有效率距离50远近第78页/共117页卡方值与样本数成正比已知已知A组疗效组疗效80,B组疗效组疗效60,需多少病人方显著差异?,需多少病人方显著差异?AB有效有效80806060140140无效无效202040406060100100100100200200P=0.002030.00203卡方值卡方值= 9.523819.5

34、2381P=0.050.05卡方值卡方值= 3.841463.84146每组人数约每组人数约80人人第79页/共117页样本量大小量反应的样本例数:由t检验逆运算成组均数:配对均数N=R( S )2 +2 X1-X2 第80页/共117页成组成组配对配对可信度可信度 809095809095 0.20.10.050.20.10.050.0515.820.926.07.710.112.50.0124.930.035.112.615.017.4R值(双侧)第81页/共117页质反应两组质反应两组可信度可信度809095 0.20.10.05单侧单侧0.053.14.35.450.015.026.5

35、27.92双侧双侧0.053.925.256.520.015.867.458.95R值第82页/共117页1 - (P1+P2-1)2 (P1-P2 )2N=RExp: P1 =0.8,P2=0.6,R=3.92,n=80质反应样本例数第83页/共117页影响样本数因素:影响样本数因素:药效药效 个体差异个体差异 实验技术实验技术 统计处理:统计处理: 例数相等例数相等 计量较计数计量较计数 配对较分组配对较分组 单侧较双侧单侧较双侧 两类错误两类错误第84页/共117页药理实验中的样本量 实验动物例数小动物(mouse,rat):计量:每组n=10; 3-5剂量组:n8; 计数:n=30中等

36、动物(rabbit,guinea pig):计量:每组6大动物(dog , cat):计量:每组5 计数:n 10第85页/共117页临床药效: 公认难治愈疾病(癌,狂犬)510,个例 危重:计量:1030 计数:3050 一般慢性:计量: 3050 计数:100500第86页/共117页2*2 chi test1118198卡方卡方=5.91565.9156P=0.015010.01501校正卡方校正卡方= 4.683264.68326P=0.0304582*2 chi test4004卡方卡方=8 8P=0.004680.00468校正卡方校正卡方=4.54.5P=0.033895Fish

37、er甲组甲组乙组乙组4 40 00 04 4p0.01430.0143tm甲组甲组乙组乙组4 40 00 04 4t=3.34664p=0.015484小样本定性资料分析第87页/共117页小样本定性资料分析 理论数5 有零第88页/共117页盲目套用2检验检验 免疫组化法检测免疫组化法检测ERER、PRPR受体。每例肿瘤区内计数受体。每例肿瘤区内计数500500个细胞个细胞ERER、PRPR阳性细胞百分率。阳性细胞百分率。2 2检验。检验。 阳性细胞率是具体数值阳性细胞率是具体数值, , 应属定量资料应属定量资料 以百分率均数以百分率均数, ,得均数为偏态,转换得均数为偏态,转换( (近似近

38、似t/t/非参非参数)数)第89页/共117页第90页/共117页2005Oct08BOYSGIRLS6666454562.562.556.556.564.564.550507171454578784646797948.548.566665454585846.546.577.577.5525274745353Mean69.6569.6549.6549.65SD7.2997.2994.094.09CV10.4810.488.2378.237第91页/共117页SK0,偏左,小数据偏多偏左,小数据偏多SK0.98 81001001 15 51011011 19.899993 31010102102

39、4 4111198983.53.57 71031032 210105 5303010.210.2101018181414mean9.444449.4444477.2577.257.81257.8125SD2.556912.55691 43.100443.100410.54910.549CV27.07%27.07%55.79%55.79%135.03%135.03%SK-0.0604-0.0604 -1.4385-1.4385 1.769281.76928正态正态偏右偏右偏左偏左skew coefficient,SKF(x) SKEW第92页/共117页转换清醒犬的呼吸数清醒犬的呼吸数sqrt1

40、4143.741663.7416632325.656855.6568556567.483317.4833194949.695369.6953634345.830955.8309540406.324566.3245658587.615777.6157710410410.19810.19820204.472144.4721416164 4mean46.846.86.501866.50186SD31.414131.4141 2.242462.24246CV0.671240.67124 0.344890.34489SK0.918790.91879 0.485650.48565第93页/共117页原始数

41、据原始数据log(x+1)sqrt(x)00 00 025251.414971.414975 510101.041391.04139 3.162283.16228200020003.301253.30125 44.721444.72142002002.30322.303214.142114.14212002002.30322.303214.142114.1421200020003.301253.30125 44.721444.7214mean633.571633.571 1.952181.95218 17.984217.9842SD937.269937.269 1.212131.21213 1

42、9.021819.0218CV147.93%147.93%62.09%62.09%105.77%105.77%SK1.195171.19517 -0.4393-0.4393 0.910330.91033转换第94页/共117页原始数据 log(x+1) sqrt(x)00025 1.414973510 1.041393 3.1622782000 3.301247 44.72136200 2.303196 14.14214200 2.303196 14.142142000 3.301247 44.72136平均633.5714 1.952179 17.98418标准误差354.2543 0.45

43、8141 7.189583中值200 2.303196 14.14214模式2000 3.301247 44.72136标准偏差937.2687 1.212128 19.02185样本方差878472.6 1.469253 361.8308峰值-0.86918 -0.65483 -1.10899偏斜度1.195168 -0.43934 0.910333区域2000 3.301247 44.72136最小值000最大值2000 3.301247 44.72136第95页/共117页xy0.10.13 3pearson0.30.31010r =0.7395941 13030b=2.891822.8

44、91823 33535a=15.271615.271610104040n=5 5t=1.903291.90329p=0.153130.15313Lnx-2.3026-2.30263 3r =0.967371-1.204-1.2041010b=8.605618.605610 03030a=23.781323.78131.098611.0986135352.302592.302594040n=5 5t=6.613116.61311p=0.007041转换pearson/correl,slope,intercept第96页/共117页ED50/LD50的计算Bliss法最小致死量取对数后与正态分布接

45、近第97页/共117页LD50mg/kgdeath percentagexy110.80.102.04453.72pearsoncorrel147.70.202.16944.16r = 0.9528134 0.952813196.90.332.29424.75b= 6.982996262.50.702.41915.52a= -10.9109350.01.002.54417.40n=5t=5.4366y=a+bxp=0.01220.0122x=2.279189.90189.90 x=(5-a)/b第98页/共117页偏态原因:样本多源性 记录伪迹 测量方法 脑电本身特性第99页/共117页中华医

46、学杂志2000 ,80 (5 ):336血浆纤维蛋白原水平测定使用凝血酶原时间法。计量资料间比较使用t 检验,但由于纤维蛋白原浓度呈非正态分布,故检验前作对数转化.急性脑梗死患者纤维蛋白原2455G/ A 基因多态性和血浆纤维蛋白原水平研究第100页/共117页Hp 信号序列在不同胃肠疾病的表达 幽门螺杆菌株数 s1a s1b s2胃癌 43 10 3胃炎 51 38 11溃疡 17 15 4定性资料两两比较分析第101页/共117页2分割分割 2 = 111847 , P = 0.01019 ,三种不同类型疾病分型表达的频数分三种不同类型疾病分型表达的频数分布之间的差别具有布之间的差别具有显

47、著意义显著意义。两两比较可采用。两两比较可采用2分割。分割。 胃炎和溃疡组先比较胃炎和溃疡组先比较, 2 = 0.1167 , P = 0.192 , 两组间两组间s 分型表达分型表达构成间的差异无显著意义构成间的差异无显著意义, 合并和胃癌组进行比较合并和胃癌组进行比较, 2 =111673 , P = 0.01003第102页/共117页2 分割分割 原理: : 2 2的可加性。 R R C C 表分割为若干个分割表, ,其自由度之和等于原R R C C 表的自由度, ,且各分割表2 2 p p 值之和等于原表的2 2值。第103页/共117页P=0.008180.00818NSABA+B

48、愈愈8 8181814142020不愈不愈1616181812125 5%33.3%33.3%50.0%50.0%53.8%53.8%80.0%80.0%比较NS组和A组,P0.05;合并NS组和A组,比较NS+A与B组, P0.05;合并NS组,A组, B组,比较NS+A+ B与C组, P0.01第104页/共117页Exp: 表1 开始吸烟年龄与慢性支气管炎的关系 21 21 31 41 合计 A B C D病例组 82 60 12 9 163对照组 43 67 14 4 128 合计 125 127 26 13 2912 = 10.157409 , P= 0.010144 。第105页/

49、共117页2 分割分割 吸烟龄早, ,对支气管影响大。对C C,D D组行同质性检验, 21.857,P = 0.1730。 合并为( ( C C + + D) D) 组, , 与B B 组比较, , 20.5205, P = 0.4706 合并为( ( B B + + C C + + D) D) 组, , 与A A 组比较, , 2 8.1730, P = 0. 0043第106页/共117页注意事项注意事项 所分析的问题要有实际意义所分析的问题要有实际意义,上例中上例中A 和和D 两个年龄组如果差别无显著性两个年龄组如果差别无显著性,也不能将它们合并;也不能将它们合并; 分割表的分割表的2

50、值不显著时才能进行频数的合并值不显著时才能进行频数的合并; ; 对分组过细的列联表的行或列进行合并对分组过细的列联表的行或列进行合并第107页/共117页P=0.064370.06437DF=4 4x x= =8.872458.87245多组效率下降多组效率下降P=0.036320.03632DF=3 3x x= =8.525038.52503x检验(R*C)处理处理8 88 83 33 34646151510102 24 42323处理处理8 88 86 64646151510106 62323第108页/共117页非参数检验(nonparametric test) 计量资料方差不齐或非正态

51、分布 等级资料 行列2检验仅推断构成比差异,忽视了其它等级的信息,导致信息丢失 非参数检验可推断等级强度的差异。第109页/共117页臀部注射硬结治疗结果组别 治愈例数 显效例数 无效例数超声碘离子透入 11 10 9音频电 14 24 17红外线 4 12 16第110页/共117页RIDIT无效无效49492424进步进步31313535显效显效5 51616痊愈痊愈15152525Ra=0.42610.4261t=3.739077Rb=0.57390.5739p=0.000240.00024第111页/共117页重复测量设计 试验前试验前, ,试验后的数据非独立试验后的数据非独立 时间是

52、一试验因素。时间是一试验因素。 t 检验割裂了整体设计检验割裂了整体设计,不能准确地估计和控制误差不能准确地估计和控制误差,结论不可靠。结论不可靠。区别区别 重复取样重复取样 重复测量重复测量 重复实验重复实验第112页/共117页统计方法误用总结 缺少统计学分析。缺少统计学分析。 未说明所用的统计学方法(仅有未说明所用的统计学方法(仅有P 值值) 统计方法选择不当统计方法选择不当1)1)误用参数检验误用参数检验(t检验)代替非参数检验代替非参数检验2) 2) 配对配对t与成组与成组t3) 3) t检验用于多个样本均数比较。检验用于多个样本均数比较。第113页/共117页统计方法误用总结4)4

53、)误用误用t 检验分析重复测量设计资料检验分析重复测量设计资料5)5)四格表四格表n 40 或理论频数小于或理论频数小于1 时时,用用26)6) R C 行列表错误分析等级变量资料,统计效率低。行列表错误分析等级变量资料,统计效率低。7)7)偏态和方差不齐的资料应数据转换偏态和方差不齐的资料应数据转换(对数转换、平方转换对数转换、平方转换)8)8)直线相关与回归分析直线相关与回归分析第114页/共117页统计推断(statistical inference) 随机抽取一定数量观察单位作为样本进行抽样研究(sampling study) 由样本信息推断总体特征 包括统计结论和专业结论,二者有机结合第115页/共117页P的意义 “无显著意义无显著意义”=“两组均数基本相同两组均数基本相同”? “差异显著(性)差异显著(性)”=“两均数差别很大两均数差别很大”? P 0.05:不否定无效假设,例数增加?不否定无效假设,例数增加? 结合专业判断结合专业判断第116页/共117页感谢您的观看。第117页/共117页

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!