医学统计学:两指标间的关系分析

上传人:努力****83 文档编号:170078021 上传时间:2022-11-18 格式:PPT 页数:89 大小:6.06MB
收藏 版权申诉 举报 下载
医学统计学:两指标间的关系分析_第1页
第1页 / 共89页
医学统计学:两指标间的关系分析_第2页
第2页 / 共89页
医学统计学:两指标间的关系分析_第3页
第3页 / 共89页
资源描述:

《医学统计学:两指标间的关系分析》由会员分享,可在线阅读,更多相关《医学统计学:两指标间的关系分析(89页珍藏版)》请在装配图网上搜索。

1、818 East Tianyuan Rd.Nanjing,PR China,211166|两指标间的关系分析两指标间的关系分析线性相关线性相关Linear CorrelationMedical Statistics医学统计学818 East Tianyuan Rd.Nanjing,PR China,211166|2 主要内容主要内容818 East Tianyuan Rd.Nanjing,PR China,211166|有有其父,必有其其父,必有其子子名师出高徒名师出高徒瑞雪兆丰年瑞雪兆丰年3 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,21

2、1166|4 问题的提出问题的提出2008年,甲型H1N1流感爆发的几周前818 East Tianyuan Rd.Nanjing,PR China,211166|5 问题的提出问题的提出谷歌工程师提前预测了美国冬季H1N1流感的传播。Ginsberg J,Mohebbi Ginsberg J,et al.Nature,2009,457(7232):1012-1014.818 East Tianyuan Rd.Nanjing,PR China,211166|6 图图A:2003年年2008年流感传播情况年流感传播情况图图B:2008年年5月流感爆发前几周传播情况月流感爆发前几周传播情况图1 G

3、oogle预测流感传播(黑线)与实际流感传播(红线)的比较Ginsberg J,et al.Nature,2009,457(7232):1012-1014.818 East Tianyuan Rd.Nanjing,PR China,211166|Google预测速度比美国疾控中心还要快12周;不仅预测了全美范围的传播,而且还可以预测具体到特定的地区和州。7 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166|利用了两个不同来源的数据:n搜索引擎上的5000万个高频词条流感有哪些症状?哪些是治疗咳嗽和发热的药物?n美国疾控中心近5年的流感

4、传播数据8 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166|9 问题的提出问题的提出Relationship!818 East Tianyuan Rd.Nanjing,PR China,211166|问题的提出问题的提出联系与相互影响是普遍的现象Relationship!n 人的体重往往随着身高的增加而增加。二者之间是否存在某种关联?n 某地区肺癌发病率是否和该地空气中PM2.5浓度有关?n 吸烟量与肺功能之间是否有联系?818 East Tianyuan Rd.Nanjing,PR China,211166|11 问题的提出问题的

5、提出818 East Tianyuan Rd.Nanjing,PR China,211166|两变量之间的分析方法两变量之间的分析方法n线性相关线性相关n线性回归线性回归12 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166|寻找变量间的关系是科学研究的首要目的;寻找变量间的关系是科学研究的首要目的;变量间关系的分类变量间关系的分类13 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166|R1R1R222113.14 13.14()cRSm 22223.14 1.57.07()

6、cmRS 22333.14212.56()cRSm 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166|15 问题的提出问题的提出818 East Tianyuan Rd.Nanjing,PR China,211166| 确定性的函数关系:两变量间的函数关系。随机性的相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。圆的周长与半径的关系:C2R 速度、时间与路程的关系:LST 青少年身高与年龄的关系;体重与体表面积的关系;确定性关系与相关关系确定性关系与相关关系818 East Tianyuan Rd.Nanjing,

7、PR China,211166|确定性关系与相关关系确定性关系与相关关系818 East Tianyuan Rd.Nanjing,PR China,211166|18 主要内容主要内容818 East Tianyuan Rd.Nanjing,PR China,211166|当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。相关关系相关关系818 East Tianyuan Rd.Nanjing,PR China,211166|正相关正相关(positive correlation):n若两个变量同时增加或减少

8、,变化趋势是同向的;若两个变量同时增加或减少,变化趋势是同向的;负相关负相关(negative correlation):n若一个变量增加时,另一个变量减少,变化趋势若一个变量增加时,另一个变量减少,变化趋势是反向的。是反向的。相关关系相关关系818 East Tianyuan Rd.Nanjing,PR China,211166|直线相关(直线相关(linear correlationlinear correlation),又称简单相关,),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。关系,常简称为相关。相关关系相关关

9、系818 East Tianyuan Rd.Nanjing,PR China,211166|Sir Francis Galton(1822-1911)遗传学家探险家地理学家气象学家发明家统计学家818 East Tianyuan Rd.Nanjing,PR China,211166|Heredity experiments lead to initial concepts of correlation and regression.Sweet peas experiment (1875)Symmetric studies of stature (1885)相关关系相关关系818 East Ti

10、anyuan Rd.Nanjing,PR China,211166|相关关系相关关系Sweet peas experiment Sweet peas experiment n18751875年,年,GaltonGalton把把7 7包甜豌豆种子分发给包甜豌豆种子分发给7 7位位朋友,朋友们种下这些种子,又把收获的豆子朋友,朋友们种下这些种子,又把收获的豆子寄还给寄还给GaltonGalton;nGaltonGalton研究了亲代种子和子代种子之间的关系。研究了亲代种子和子代种子之间的关系。818 East Tianyuan Rd.Nanjing,PR China,211166|Table 1

11、Data on Diameters of Parent and Daughter Seeds Generated from Galton(1894)Table 2 in Natural Inheritance.Diameter of Parent Seed(0.01 inch)Diameter of Daughter Seed(0.01 inch)1516.771617.281716.921817.351917.692018.282118.29相关关系相关关系818 East Tianyuan Rd.Nanjing,PR China,211166|26 CorrelationCorrelati

12、on exists between two variables when one of them is related to the other in some way.相关关系相关关系818 East Tianyuan Rd.Nanjing,PR China,211166|27 主要内容主要内容818 East Tianyuan Rd.Nanjing,PR China,211166|散点图(Scatter plot)在平面直角坐标系上标识两变量(x,y)间关系的统计图。散点图散点图818 East Tianyuan Rd.Nanjing,PR China,211166|16.51717.51

13、818.515161718192021Figue 1 Plot of Diameter of Daughter Seed versus Diameter of Parent Seed from the data in Table 1.(0.01 inch)818 East Tianyuan Rd.Nanjing,PR China,211166|Symmetric studies of statureSymmetric studies of staturen为了研究父亲与成年儿子身高之间的关系,卡尔为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔皮尔逊测量了逊测量了10781078对父子的身高。

14、对父子的身高。n把把10781078对对数据画散点图数据画散点图。n水平轴水平轴X X代表父亲身高,垂直轴代表父亲身高,垂直轴Y Y代表儿子身高。代表儿子身高。30 散点图散点图818 East Tianyuan Rd.Nanjing,PR China,211166|31 它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,线性,其主要部分是一个椭圆。818 East Tianyuan Rd.Nanjing,PR China,211166|BSA(103cm2),Y32 Weight(kg),X1112131415165.05.56.06.5y,Survival rate(%)x,Month

15、01234567891011 12020406080100818 East Tianyuan Rd.Nanjing,PR China,211166|33 主要内容主要内容818 East Tianyuan Rd.Nanjing,PR China,211166|反映两定量指标间的相关关系用Pearson相关系数,r;Pearson correlation coefficient;用以说明具有直线关系的两个数值变量间相关关系的密切程度和相关方向的指标。Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|Pearson相关系数相关系

16、数818 East Tianyuan Rd.Nanjing,PR China,211166|22XYXX YYXXYYrXXYlYll2XXlXX2YYlYYX 的离均差平方和:Y 的离均差平方和:X与Y 间的离均差积和:YYXXlXYPearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|GaltonGalton曾探讨成年时身高是否与两岁时的身高曾探讨成年时身高是否与两岁时的身高(单位:英寸)有关。(单位:英寸)有关。两岁时的两岁时的身高(英寸)身高(英寸)3939 3030 3232 3434 3535 3636 3636 3

17、030成年成年身高身高(英寸)(英寸)7171 6363 6363 6767 6868 6868 7070 6464Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|绘制散点图Y 成年后身高(单位:英寸)X 2岁时的身高(单位:英寸)3032343638406365676971818 East Tianyuan Rd.Nanjing,PR China,211166|2222272931870.008XXXlXXXn22225343571267.508YYYlYYYn272 5341822165.008XYXYlXXYYXYn

18、Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|65.000.945670.00 67.50XYXX YYlrllPearson相关系数相关系数成年时身高与两岁时的身高的相关系数为成年时身高与两岁时的身高的相关系数为0.94560.9456。818 East Tianyuan Rd.Nanjing,PR China,211166|10名名3岁男童体重与体表面积的关系岁男童体重与体表面积的关系 编号编号 体重体重(X X,kg,kg)体表面积体表面积(Y Y,10,103 3cmcm2 2)1 111.011.05.2835

19、.2832 211.811.85.2995.2993 312.012.05.3585.3584 412.312.35.2925.2925 513.113.15.6025.6026 613.713.76.0146.0147 714.414.45.8305.8308 814.914.96.1026.1029 915.215.26.0756.075 101016.016.06.4116.411 合计合计133.4133.457.26657.266Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|10名名3岁男童体重与体表面积散点图

20、岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)818 East Tianyuan Rd.Nanjing,PR China,211166|9396.55439.19040.247266.544.13XYYYXXlllY X 9579.05439.19040.249396.5rPearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|Table 1 Data on Diameters of Parent and Daughter Seeds Generated fro

21、m Galton(1894)Table 2 in Natural Inheritance.Diameter of Parent Seed Diameter of Daughter Seed 1516.771617.281716.921817.351917.692018.282118.29Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|18 17.5128 2.23 7.36XXYYXYX Ylll 93.023.22836.7YYXXXYlllrPearson相关系数相关系数818 East Tianyuan Rd.Nan

22、jing,PR China,211166|Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|2222()()()()11()()()()1iixyxyiiiiiiXYXX YYxXyYSrS SxXyYxnnnXyYxXyYlll 协方差标准差 协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。Pearson相关系数的含义相关系数的含义818 East Tianyuan Rd.Nanjing,PR China,211166|Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,P

23、R China,211166|-1 r 1 r0为正相关 r0为负相关 r0为零相关或无相关 相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。Pearson相关系数的性质相关系数的性质818 East Tianyuan Rd.Nanjing,PR China,211166|50 完全负相关零相关完全正相关零相关负相关正相关Pearson相关系数的性质相关系数的性质818 East Tianyuan Rd.Nanjing,PR China,211166|51 Sign Magnitude Strength DirectionPearson相关系数的性质相关系数的

24、性质818 East Tianyuan Rd.Nanjing,PR China,211166|Pearson相关系数的性质相关系数的性质818 East Tianyuan Rd.Nanjing,PR China,211166|r=-1-1r 0r=00r 1r=1Pearson相关系数的性质相关系数的性质相关系数的大小示意图818 East Tianyuan Rd.Nanjing,PR China,211166|54 Sign Magnitude Strength DirectionPearson相关系数的性质相关系数的性质818 East Tianyuan Rd.Nanjing,PR Chi

25、na,211166|Pearson相关系数的性质相关系数的性质818 East Tianyuan Rd.Nanjing,PR China,211166|Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|57 XY 0总体总体Pearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR China,211166|58 XYXY样本样本0r 0总体总体Pearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR China,2

26、11166|H 0:0,亲代种子直径与子代无相关关系;H 1:0,亲代种子直径与子代有相关关系。=0.05。t 服从自由度为n-2的 t 分布。2102nrrsrtrPearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR China,211166|220.935.77110.93272rtrn自由度72,P=0.0022拒绝H0,接受H1,差别有统计学意义。可以认为亲代种子直径与子代之间有正相关关系,相关系数为0.93。Pearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR Ch

27、ina,211166|2102nrrsrtrH 0:0,体重与体表面积无相关关系;H 1:0,体重与体表面积有相关关系。=0.05。t 服从自由度为n-2的 t 分布。Pearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR China,211166|4369.92109579.019579.02122nrrt自由度102,P0.001拒绝H0,接受H1,差别有统计学意义。可以认为3岁男童体重与体表面积之间有正相关关系。Pearson相关系数的假设检验相关系数的假设检验818 East Tianyuan Rd.Nanjing,PR Chi

28、na,211166|Pearson相关系数相关系数818 East Tianyuan Rd.Nanjing,PR China,211166|总体相关系数的区间估计总体相关系数的区间估计从相关系数从相关系数 不等于不等于0 0的总体中抽样,样本相关系的总体中抽样,样本相关系数的分布是数的分布是偏态偏态的。的。818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的抽样分布(=-0.8)-0.8-0.6-0.4-0.20.00100200300-1.0818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的抽样

29、分布(=0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的抽样分布(=0.8)00.20.40.60.81.00100200300818 East Tianyuan Rd.Nanjing,PR China,211166|R.A.Fisher(1921)的 z 变换1111ln2122zzeerrrz z 近似服从均数为 ,标准差为 的正态分布。)1/()1(ln21rr3/1n818 East Tianyuan Rd.Nanjing,PR Chi

30、na,211166|相关系数的z 值的抽样分布(=-0.8)00.51.01.52.0050100150200818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的z 值的抽样分布(=0)-2-1012050100150200818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的z 值的抽样分布(=0.8)01234050100150200818 East Tianyuan Rd.Nanjing,PR China,211166|相关系数的可信区间估计将 r 变换为 z;根据 z 服从正态分布,估计 z

31、的可信区间;再将 z 变换回 r。31nuzsuzz818 East Tianyuan Rd.Nanjing,PR China,211166|73 Fishers 变换变换 r z 正态近似正态近似 Fishers 反变换反变换 的的95CI z的的95CI 相关系数的可信区间估计相关系数的可信区间估计818 East Tianyuan Rd.Nanjing,PR China,211166|2z2 0.91202z2 0.91202z2 2.66502z2 2.665011 0.9456ln()1.788521 0.94561.7885 1.96/83=(0.9120,2.6650)e110.

32、7221e+11e110.9904e+11lowupzeleele相关系数的可信区间估计相关系数的可信区间估计818 East Tianyuan Rd.Nanjing,PR China,211166|75 主要内容主要内容818 East Tianyuan Rd.Nanjing,PR China,211166| 相关关系不等于因果关系;相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;极端值可能影响相关系数;注意相关关系成立的数据范围;警惕虚假相关。相关分析的正确应用818 East Tianyuan Rd.Nanjing,PR China,211166|相关分析的正确应用

33、相关分析的正确应用 定量资料在进行相关分析(Pearson相关)前,需作散点图,从散点图的趋势判断是否可以作线性相关分析;818 East Tianyuan Rd.Nanjing,PR China,211166|某地某地160名名20岁男子身高与体重散点图岁男子身高与体重散点图(双变量正态分布双变量正态分布)818 East Tianyuan Rd.Nanjing,PR China,211166|成都市男中小学生12个年龄组的平均身高 818 East Tianyuan Rd.Nanjing,PR China,211166|紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细

34、胞密度(个/mm3)818 East Tianyuan Rd.Nanjing,PR China,211166|某肿瘤病人的生存率 818 East Tianyuan Rd.Nanjing,PR China,211166|免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系 818 East Tianyuan Rd.Nanjing,PR China,211166|26名病人的胃液的pH值及尿中亚硝酸盐浓度的散点图 尿中亚硝酸盐的浓度胃液的pH值818 East Tianyuan Rd.Nanjing,PR China,211166|84 建湖县19781985年疟疾逐月发病数 月份月发病人

35、数 818 East Tianyuan Rd.Nanjing,PR China,211166|我国19401988年间不同月份的男性婴儿死亡率()的季节性分析 男性婴儿死亡率()月份818 East Tianyuan Rd.Nanjing,PR China,211166|识别离群值;PQ图10.5 离群值对相关的影响相关分析的正确应用相关分析的正确应用818 East Tianyuan Rd.Nanjing,PR China,211166|排除间杂性。(a)(b)样本甲观察点 样本乙观察点图10.6 样本的间杂性对相关性的误导相关分析的正确应用相关分析的正确应用818 East Tianyuan Rd.Nanjing,PR China,211166|88 总结总结818 East Tianyuan Rd.Nanjing,PR China,211166|

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!