Logistic 回归模型

上传人:仙*** 文档编号:161440207 上传时间:2022-10-14 格式:PPT 页数:80 大小:608KB
收藏 版权申诉 举报 下载
Logistic 回归模型_第1页
第1页 / 共80页
Logistic 回归模型_第2页
第2页 / 共80页
Logistic 回归模型_第3页
第3页 / 共80页
资源描述:

《Logistic 回归模型》由会员分享,可在线阅读,更多相关《Logistic 回归模型(80页珍藏版)》请在装配图网上搜索。

1、1Logistic 回归模型回归模型 计量资料单因素统计分析计量资料单因素统计分析对于两组计量资料的比较,一般采用对于两组计量资料的比较,一般采用t检检验或秩和检验。验或秩和检验。对于两个变量的相关分析采用对于两个变量的相关分析采用Pearson相关分析或相关分析或Spearman相关分析相关分析 考虑多因素的影响,对于应变量考虑多因素的影响,对于应变量(反应变反应变量量)为计量资料,一般可以考虑应用多重为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。线性回归模型进行多因素分析。2Logistic 回归模型回归模型 单因素的分类资料统计分析,一般采用单因素的分类资料统计分析,一般采

2、用Pearson 2进行统计检验,用进行统计检验,用Odds Ratio及其及其95%可信区间评价关联程度。可信区间评价关联程度。考虑多因素的影响,对于反应变量为分考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型类变量时,用线性回归模型P=a+bx就不就不合适了,应选用合适了,应选用Logistic回归模型进行统回归模型进行统计分析。计分析。3Logistic 回归模型回归模型 按研究设计分类按研究设计分类非配对设计:非条件非配对设计:非条件Logistic回归模型回归模型配对的病例对照:条件配对的病例对照:条件Logistic回归模型回归模型 按反应变量分类按反应变量分类二分类二分

3、类Logistic回归模型回归模型(常用常用)多分类无序多分类无序Logistic回归模型回归模型多分类有序多分类有序Logistic回归模型回归模型4Logistic 回归模型回归模型 通过下例引入和复习相关概念通过下例引入和复习相关概念 例如:研究患某疾病与饮酒的关联性例如:研究患某疾病与饮酒的关联性 患病率患病率 P1=a/m1 P2=b/m2 饮饮酒酒(X=1)不不饮饮酒酒(X=0)合合计计 患患病病(y=1)a b n1 未未患患病病(y=0)c d n2 合合计计 m1 m2 N 5Logistic 回归模型回归模型 Odds(优势)(优势)(1)111111PPOddsPPP 1

4、POddsPP越大越大,则则Odds越大;越大;P越小越小,则则Odds越小越小 并且并且 0Odds+6Logistic 回归模型回归模型 P与与Odds一一对应一一对应 对于两个对于两个Odds的比较,一般用它们的的比较,一般用它们的Ratio,并称为并称为Odds Ratio(OR),其定义,其定义如下:如下:其样本估计统计量为其样本估计统计量为1OddsPOdds12OddsOROddsadORbc7Logistic 回归模型回归模型 故比较两个率故比较两个率 比较比较OR=1?OR1?OR1?12121PPOddsOddsOR12121PPOddsOddsOR8Logistic 回归

5、模型回归模型 因为因为0Odds+所以所以 -ln(Odds)|z|x.4117232.1780719 2.31 0.021 _cons-7.962891.1162679-68.49 0.000 2.31()bzse b17Logistic 回归模型回归模型 关键是如果关键是如果 0,意味自变量,意味自变量X与与Y无关联无关联性。性。由于由于 的估计存在抽样误差,即使的估计存在抽样误差,即使=0,其估计值其估计值b一般不为一般不为0,故,故需检验需检验 0?H0:0 H1:0 0.05 检验统计量检验统计量 可以证明:可以证明:H0:0 为真时,为真时,z近似服从标近似服从标准正态分布,即:准

6、正态分布,即:|z|1.96,P0.05,拒绝拒绝H0()bzse b18Logistic 回归模型回归模型 实例实例1的回归系数估计为的回归系数估计为 se(b)=0.1780719,z=b/se=2.31,P=0.021 则拒绝则拒绝H0。如果对模型中所有的自变量进行检验,如果对模型中所有的自变量进行检验,则称为模型检验。如实例则称为模型检验。如实例2,对两个自变,对两个自变量进行检验,故这是模型检验。量进行检验,故这是模型检验。20.05,df25Logistic 回归模型回归模型 应用应用Stata软件进行最大似然估计,得到软件进行最大似然估计,得到模型拟合的主要结果如下模型拟合的主要

7、结果如下 似然函数比为似然函数比为2ln(L)76.32,df=2,P0.001,因此拒绝,因此拒绝H0:1=2=0,可以,可以认为认为 1和和 2不全为不全为0。26Logistic 回归模型回归模型 应用应用Stata软件进行最大似然估计,得到软件进行最大似然估计,得到回归系数估计的主要结果如下回归系数估计的主要结果如下 饮酒饮酒:-0.000021 0.999979ORe27Logistic 回归模型回归模型 在本例中,对于同为吸烟或不吸烟的对象在本例中,对于同为吸烟或不吸烟的对象而言而言(x2相对固定不变相对固定不变),饮酒饮酒(x1=1)的对数的对数Odds为为 不饮酒不饮酒(x1=

8、0)的对数的对数Odds为为1 10122()xLog Oddsx1 0022()xLog Oddsx28Logistic 回归模型回归模型 则饮酒的对数则饮酒的对数Odds Ratio为为 即:饮酒的即:饮酒的 意义:对于同为吸烟的对象或者同意义:对于同为吸烟的对象或者同为不吸烟的对象,其饮酒的为不吸烟的对象,其饮酒的 故称校正吸烟后故称校正吸烟后OR,而前者未考虑,而前者未考虑吸烟的单因素吸烟的单因素OR称为称为crude OR1 11 01ln()()()xxORLog OddsLog Odds1ORe1ORe29Logistic 回归模型回归模型 饮酒饮酒:P=1 校正了吸烟因素的情况

9、下,没有足够的校正了吸烟因素的情况下,没有足够的证据推断饮酒与证据推断饮酒与AMI患病有关联性。患病有关联性。吸烟:吸烟:P1ORe30Logistic 回归模型回归模型 实例实例3:采用病例对照设计研究吸烟和家:采用病例对照设计研究吸烟和家属史与患肺癌的关联性。属史与患肺癌的关联性。用用x1=1,0分别表示吸烟和不吸烟;分别表示吸烟和不吸烟;x2=1,0分别表示有无家属史;用分别表示有无家属史;用y=1,0分别表示分别表示患肺癌和未患肺癌。患肺癌和未患肺癌。有有家家属属史史 无无家家属属史史 患患肺肺癌癌 未未患患肺肺癌癌 患患肺肺癌癌 未未患患肺肺癌癌 吸吸烟烟 200 50 80 6 不

10、不吸吸烟烟 300 450 270 310 合合计计 500 500 350 316 31Logistic 回归模型回归模型 一般而言,吸烟和家属史均是肺癌的重要一般而言,吸烟和家属史均是肺癌的重要相关因素,很有可能这两个因素对患肺癌相关因素,很有可能这两个因素对患肺癌有交互作用,因此采用下列含有交互作用有交互作用,因此采用下列含有交互作用项的项的Logistic模型。模型。其中其中x1和和x2的乘积项的乘积项x1x2称为交互作用项称为交互作用项01 1223 1 2()Logit Pxxx x32Logistic 回归模型回归模型 用用Stata软件对实例软件对实例3的资料拟合上述模型,得的

11、资料拟合上述模型,得到下列结果:到下列结果:3=0.955825,P0.04,差别有统计学意义,差别有统计学意义,可以认为吸烟和家属史对患肺癌有交互作用。可以认为吸烟和家属史对患肺癌有交互作用。变变量量 回回归归系系数数.P 95%Conf.Interval x1 1.791759 0.000 1.449155 2.134364 x2.2481449 0.026 0.029683 0.4666067 x12.955828 0.040 0.0436748 1.867981 _cons-.4054651 0.000-0.5515522 -0.259378 33Logistic 回归模型回归模型 由

12、于本例模型为由于本例模型为 对于无家属史,对于无家属史,x2=0代入模型,得到代入模型,得到 由回归系数与由回归系数与OR的关系,得到吸烟的:的关系,得到吸烟的:11.791759 6ORee01 1223 1 2()Logit Pxxx x01 1()Logit Px95%CI=(4.3,8.5)P =3.84,故拒绝,故拒绝H0,可,可以认为以认为 1+3 0,差别有统计学意义,可,差别有统计学意义,可以认为吸烟者患肺癌的风险更大。以认为吸烟者患肺癌的风险更大。221313()40.58var()20.05,136Logistic 回归模型回归模型 同理,为了评价家属史与肺癌的关联性,同理

13、,为了评价家属史与肺癌的关联性,根据下列根据下列Logistic模型模型 对于不吸烟对于不吸烟x1=0,则上述,则上述Logistic模型为模型为 家属史的家属史的 P=0.认为认为0260.05,两个药的疗效差异无统计学意义。两个药的疗效差异无统计学意义。模型模型 病情重病情重x2=1代入模型,得到代入模型,得到1.2047944 02131()()Logit Px01 12 23 1 2()Logit Pxxx x44Logistic 回归模型回归模型 即:病情重时的药物变量即:病情重时的药物变量x1的回归系数为的回归系数为 对于在病情重的情况下,两个药的疗效是否对于在病情重的情况下,两个

14、药的疗效是否有差异需检验有差异需检验 1+3=0,用,用Stata软件计算得:软件计算得:检验统计量检验统计量 242.16,df=1,P045Logistic 回归模型回归模型 在病情轻的情况下,两个药的疗效差异在病情轻的情况下,两个药的疗效差异无统计学意义。无统计学意义。在病情重的情况下,可以认为在病情重的情况下,可以认为A药的疗效药的疗效优于优于B药。药。即:不能简单地称即:不能简单地称A药优于药优于B药或两个药药或两个药的疗效差异无统计学意义。的疗效差异无统计学意义。请注意:在有交互作用的模型中,其主请注意:在有交互作用的模型中,其主效应效应(本例本例x1)解释应谨慎。)解释应谨慎。4

15、6Logistic 回归模型回归模型1.交互作用的意义就是不同层(某因交互作用的意义就是不同层(某因素的不同水平)另一个研究因素与素的不同水平)另一个研究因素与应变量的之间的关联程度是不同的。应变量的之间的关联程度是不同的。2.在回归分析和方差分析中,在回归分析和方差分析中,经统计经统计检验得到交互作用项有统计学意义检验得到交互作用项有统计学意义只是统计分析的中间结果,只是统计分析的中间结果,不要简不要简单归结为协同作用或拮抗作用,一单归结为协同作用或拮抗作用,一般要做进一步分析般要做进一步分析。47Logistic 回归模型回归模型3.在有交互作用的在有交互作用的Logistic模型中,对交

16、模型中,对交互作用项要根据研究目的进行解释,一互作用项要根据研究目的进行解释,一般应进行分层作简单效应检验,特别很般应进行分层作简单效应检验,特别很可能某个层有统计学意义而另一个层没可能某个层有统计学意义而另一个层没有统计学意义。主效应的解释要特别注有统计学意义。主效应的解释要特别注意,要结合回归模型和变量定义进行谨意,要结合回归模型和变量定义进行谨慎地解释。慎地解释。4.应用交互作用模型可以比较多个应用交互作用模型可以比较多个OR。48Logistic 回归模型回归模型 例例5:用横断面调查设计,分析职业与患:用横断面调查设计,分析职业与患糖尿病的关联性。糖尿病的关联性。职业:用职业:用x1

17、=1,2,3分别表示农民,工人和分别表示农民,工人和干部干部(含知识分子含知识分子)。用用x2表示年龄。表示年龄。由于由于x1是分类无序变量,必须用亚元变是分类无序变量,必须用亚元变量表示。量表示。49Logistic 回归模型回归模型 职业变量职业变量x1直接引入直接引入Logistic模型是不合适的,模型是不合适的,因为模型中引入因为模型中引入x1后,模型为后,模型为 若若 10,导致,导致x1越大,患病概率相对越大;越大,患病概率相对越大;若若 10.05,即:对于,即:对于职业为工人与农民而言,其与患病之间的职业为工人与农民而言,其与患病之间的关联性无统计学意义。关联性无统计学意义。y

18、 回归系数 P 值 95%CI x12.3021807 0.401-0.4034157 1.007777 x13 1.164267 0.003 0.4093795 1.919155 x2.0458908 0.000 0.0236281 0.0681536 _cons-2.449857 0.000-3.557851 -1.341864 52Logistic 回归模型回归模型 x13的回归系数P0.0030.05,说明干部与农民的职业与患糖尿病有关联,其 干部与工人比较,用Stata软件检验12=13,P=0.0230.05,差异有统计学意义。X2的回归系数P0.001,说明年龄与患病也有关联,其

19、OR=1.04。1.1642673.20ORe53Logistic 回归模型回归模型 在在Logistic模型中,二分类变量是不区分有序模型中,二分类变量是不区分有序和无序的,因为回归系数的正负号能处理两和无序的,因为回归系数的正负号能处理两分类变量所对应的概率大小问题。分类变量所对应的概率大小问题。在在Logistic模型中,用亚元处理多分类自变量模型中,用亚元处理多分类自变量时,对同一个因素的一组亚元而言,必须同时,对同一个因素的一组亚元而言,必须同时引入模型或同时不引入模型,不能若干个时引入模型或同时不引入模型,不能若干个亚元在模型中,其它亚元不在模型中,这样亚元在模型中,其它亚元不在模

20、型中,这样会导致模型的参数意义发生改变以致错误解会导致模型的参数意义发生改变以致错误解释参数意义。释参数意义。54Logistic 回归模型回归模型 例例6:用横断面调查设计,分析肥胖与患:用横断面调查设计,分析肥胖与患糖尿病的关联性。糖尿病的关联性。职业:用职业:用x1=0,1,2分别表示体重正常,超分别表示体重正常,超重和肥胖。重和肥胖。用用x2表示年龄。表示年龄。x1是有序的分类变量是有序的分类变量(等级变量等级变量)Y=1表示患糖尿病,表示患糖尿病,Y=0表示未患糖尿病。表示未患糖尿病。55Logistic 回归模型回归模型 有序分类变量可以直接引入有序分类变量可以直接引入Logist

21、ic模型,也模型,也可以按无序分类变量方式采用亚元变量引入可以按无序分类变量方式采用亚元变量引入模型,一般视资料而决定。模型,一般视资料而决定。有序分类变量直接引入模型:有序分类变量直接引入模型:体重正常体重正常x1=0,体重超重体重超重x1=1,体重超重与正常的对数体重超重与正常的对数OR为为01 122ln()()OddsLogit Pxx|0022ln()Oddsx|10122ln()Oddsx56Logistic 回归模型回归模型 由由 体重正常体重正常x1=0 体重超重体重超重x1=1,体重超重与正常的对数体重超重与正常的对数OR为为 作对数反变换,得到体重超重与正常的作对数反变换,

22、得到体重超重与正常的|0022ln()Oddsx|10122ln()Oddsx|1|01ln()ln()ln()OROddsOdds1ORe01 12 2ln()Oddsxx57Logistic 回归模型回归模型 由由 体重超重体重超重x1=1,体重肥胖体重肥胖x1=2,体重肥胖与超重的对数体重肥胖与超重的对数OR为为 作对数反变换,得到体重肥胖与超重的作对数反变换,得到体重肥胖与超重的|10122ln()Oddsx|20122ln()2Oddsx|2|11ln()ln()ln()OROddsOdds1ORe01 12 2ln()Oddsxx58Logistic 回归模型回归模型 由此可见,如

23、果直接将有序多分类变量由此可见,如果直接将有序多分类变量引入模型,就是假定相邻两个等级的总引入模型,就是假定相邻两个等级的总体体OR相同,并且不难验证:体重肥胖与相同,并且不难验证:体重肥胖与体重正常的体重正常的 。综合上述,若满足相邻两个等级的总体综合上述,若满足相邻两个等级的总体OR相同的条件下可以直接将有序多分类相同的条件下可以直接将有序多分类变量引入模型,对于不满足这个条件,变量引入模型,对于不满足这个条件,则应采用亚元变量引入模型。则应采用亚元变量引入模型。12ORe59Logistic 回归模型回归模型 对于多分类有序自变量,可以用似然比检对于多分类有序自变量,可以用似然比检验的方

24、法检验相邻两个等级的总体验的方法检验相邻两个等级的总体OR是是否相同。否相同。在模型在模型1中引入亚元变量,其定义如下:中引入亚元变量,其定义如下:体重正常体重正常体重超重体重超重体重肥胖体重肥胖x1012X11010 x1200160Logistic 回归模型回归模型 模型模型1 用最大似然法得到的似然函数值为用最大似然法得到的似然函数值为L1 模型模型2:用最大似然法得到的似然函数值为用最大似然法得到的似然函数值为L2 显然两个模型等价意味显然两个模型等价意味 1=11且且2 1=12 似然比检验统计量为似然比检验统计量为2ln(L)=2(ln(L1)-ln(L2)011 1112 122

25、2()Logit Pxxx0122()Logit Pxx61Logistic 回归模型回归模型 H0:模型:模型1等价于模型等价于模型2 H1:模型:模型1不等价不等价模型模型2 =0.05 H0为真时,为真时,2ln(L)近似服从自由度为近似服从自由度为1(自自变量的分类数变量的分类数2)的的 2分布,即:分布,即:检验统检验统计量计量 ,则拒绝,则拒绝H0,选用引,选用引入亚元的模型入亚元的模型1。20.05,2()dfLn L62Logistic 回归模型回归模型 在多因素统计分析中,多个自变量之间存在多因素统计分析中,多个自变量之间存在相关性,往往相互影响,研究者希望寻在相关性,往往相

26、互影响,研究者希望寻找主要影响应变量找主要影响应变量Y的因素。的因素。理论上,只要把各种因素组合都试一遍,理论上,只要把各种因素组合都试一遍,寻找变量个数最多,每个变量均有统计学寻找变量个数最多,每个变量均有统计学意义,并且模型拟合程度最好的模型,这意义,并且模型拟合程度最好的模型,这种模型称为最佳预测模型,这种方法称为种模型称为最佳预测模型,这种方法称为寻找最优子集,当变量较多时很难实现。寻找最优子集,当变量较多时很难实现。63Logistic 回归模型回归模型 为了比较方便地找到最佳预测回归模型,为了比较方便地找到最佳预测回归模型,一般采用逐步回归的分析策略建立拟最一般采用逐步回归的分析策

27、略建立拟最佳预测回归模型。佳预测回归模型。逐步回归采用逐个增加最佳变量的方式逐步回归采用逐个增加最佳变量的方式或逐个减少最差的变量方式找到最佳或或逐个减少最差的变量方式找到最佳或拟最佳回归模型。拟最佳回归模型。64Logistic 回归模型回归模型逐步回归有逐步回归有4种方式:种方式:1.前进法前进法:2.最开始时,模型中无任何自变量,然最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入后逐个引入变量进入模型,每次在未进入模型的所有变量中挑选一个变量,其模型的所有变量中挑选一个变量,其P是是最小且最小且P值值,每引入一个变量,重新拟,每引入一个变量,重新拟合一次模型,逐步引入

28、变量直至没有满足合一次模型,逐步引入变量直至没有满足上述条件的变量可以引入模型为止。上述条件的变量可以引入模型为止。65Logistic 回归模型回归模型2.后退法:最开始时,把所有的变量引入后退法:最开始时,把所有的变量引入模型,然后逐次把模型,然后逐次把P值最大并且值最大并且P 的的变量剔除出模型,每次只剔除一个变量,变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按每次剔除一个变量后重新拟合模型,按照上述剔除标准继续剔除变量,直至模照上述剔除标准继续剔除变量,直至模型中的所有变量的型中的所有变量的P 为止。为止。66Logistic 回归模型回归模型3.前进逐步回归法

29、前进逐步回归法4.最开始时,模型中无任何自变量,然后最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入模逐个引入变量进入模型,每次在未进入模型的所有变量中挑选一个变量,其型的所有变量中挑选一个变量,其P是最小是最小且且P值值 的变量,若有将其剔出模型,的变量,若有将其剔出模型,然后重新拟合一次模型,逐步引入变量直然后重新拟合一次模型,逐步引入变量直至没有满足上述条件的变量可以引入模型至没有满足上述条件的变量可以引入模型为止。为止。67Logistic 回归模型回归模型4.后退逐步回归法后退逐步回归法5.最开始时,把所有的变量引入模型,然最开始时,把所有的变量引入模型,然后逐次

30、把后逐次把P值最大并且值最大并且P 的变量剔除出模的变量剔除出模型,每次只剔除一个变量,每次剔除一个变型,每次只剔除一个变量,每次剔除一个变量后考察未在模型中的变量中是否存在量后考察未在模型中的变量中是否存在P 的变量,若有重新引入模型,然后的变量,若有重新引入模型,然后重新拟合重新拟合模型,按照上述剔除标准继续剔除变量,直模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的至模型中的所有变量的P0.05,故剔除,故剔除X171Logistic 回归模型回归模型y y 回归系数回归系数 P P 9595 CI CI x2x2 .0513415.0513415 0.0010.001 .02

31、12178.0212178 .0814652.0814652 x3x3 .0804055.0804055 0.3860.386 -.1013013.1013013 .2621124.2621124 x4x4 .9146755.9146755 0.0040.004 .2882838.2882838 1.5410671.541067 x5x5 .8314381.8314381 0.0040.004 .263405.263405 1.3994711.399471 x6x6 .1943919.1943919 0.7180.718 -.8616064.8616064 1.250391.25039 x7x

32、7 -.5055541.5055541 0.3690.369 -1.6082291.608229 .5971208.5971208 _cons_cons -8.546978.546979 9 0.0030.003 -14.2197214.21972 -2.874242.87424 X6的的P值最大并且值最大并且P0.05,故剔除,故剔除X672Logistic 回归模型回归模型y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x2 2 .0 05 51 13 35 58 82 2 0 0.0 00 01 1 .0 02 21 12 27 74 41 1 .0 08 81

33、14 44 42 22 2 x x3 3 .0 08 80 00 03 35 57 7 0 0.3 38 87 7 -.1 10 01 14 41 19 9 .2 26 61 14 49 90 05 5 x x4 4 .9 90 04 41 16 61 18 8 0 0.0 00 04 4 .2 28 80 07 74 49 97 7 1 1.5 52 27 75 57 74 4 x x5 5 .8 84 41 11 11 18 83 3 0 0.0 00 04 4 .2 27 75 53 32 22 29 9 1 1.4 40 06 69 91 14 4 x x7 7 -.5 54 40 0

34、2 28 88 88 8 0 0.3 33 30 0 -1 1.6 62 26 66 64 43 3 .5 54 46 60 06 65 58 8 _ _c co on ns s -8 8.2 26 65 59 97 73 3 0 0.0 00 03 3 -1 13 3.7 71 11 11 12 2 -2 2.8 82 20 08 82 24 4 X3的的P值最大并且值最大并且P0.05,故剔除,故剔除X373Logistic 回归模型回归模型y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x2 2 .0 05 50 07 73 32 23 3 0 0.0 00 01

35、 1 .0 02 20 07 72 26 6 .0 08 80 07 73 38 86 6 x x4 4 .8 89 91 13 39 94 43 3 0 0.0 00 05 5 .2 26 69 92 26 66 66 6 1 1.5 51 13 35 52 22 2 x x5 5 .8 82 23 34 44 43 36 6 0 0.0 00 04 4 .2 26 60 05 50 06 67 7 1 1.3 38 86 63 38 8 x x7 7 -.4 45 57 71 16 66 61 1 0 0.4 40 01 1 -1 1.5 52 24 47 76 68 8 .6 61 10

36、 04 43 35 58 8 _ _c co on ns s -6 6.3 38 80 06 64 49 9 0 0.0 00 00 0 -9 9.6 68 86 62 25 5 -3 3.0 07 75 50 04 48 8 X7的的P值最大并且值最大并且0.05,故剔除,故剔除X774Logistic 回归模型回归模型y y 回归系数回归系数 P P 95%CI95%CI x2x2 .0492955.0492955 0.0010.001 .0195836.0195836 .0790075.0790075 x4x4 .9214579.9214579 0.0030.003 .3036946.3

37、036946 1.5392211.539221 x5x5 .8396782.8396782 0.0030.003 .2778044.2778044 1.4015521.401552 _cons_cons -6.9949566.994956 0.0000.000 -9.9975319.997531 -3.9923813.992381 所有变量的所有变量的P值均值均=0.0510 removing x13.p=0.7183=0.0510 removing x64.p=0.3873=0.0510 removing x35.p=0.4013=0.0510 removing x776Logistic 回

38、归模型回归模型 得到下列回归系数的估计得到下列回归系数的估计 由上述结果可知与糖尿病患病的主要影响由上述结果可知与糖尿病患病的主要影响因素是年龄因素是年龄x2,家属史,家属史x4和总胆固醇和总胆固醇x5。y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x4 4 .9 92 21 14 45 57 79 9 0 0.0 00 03 3 0 0.3 30 03 36 69 94 46 6 1 1.5 53 39 92 22 21 1 x x2 2 .0 04 49 92 29 95 55 5 0 0.0 00 01 1 0 0.0 01 19 95 58 83 36 6 0

39、 0.0 07 79 90 00 07 75 5 x x5 5 .8 83 39 96 67 78 82 2 0 0.0 00 03 3 0 0.2 27 77 78 80 04 44 4 1 1.4 40 01 15 55 52 2 _ _c co on ns s -6 6.9 99 94 49 95 56 6 0 0.0 00 00 0 -9 9.9 99 97 75 53 31 1 -3 3.9 99 92 23 38 81 1 77Logistic 回归模型回归模型 逐步回归是寻找主要影响因素的一种回逐步回归是寻找主要影响因素的一种回归策略,又称建立最佳预测模型。归策略,又称建立最佳预

40、测模型。进入回归模型的变量可以推断这些变量进入回归模型的变量可以推断这些变量与应变量与应变量Y有关联,但是没有进入回归模有关联,但是没有进入回归模型的变量不能称这些变量与应变量型的变量不能称这些变量与应变量Y没有没有关联性。关联性。一般设定变量进入模型的一般设定变量进入模型的 0.05,剔除,剔除变量的变量的 0.05。78Logistic 回归模型回归模型 对于应变量为二分类,可以用对于应变量为二分类,可以用Logistic回归回归模型进行统计分析。模型进行统计分析。在在Logistic模型中,自变量可以是二分类的,模型中,自变量可以是二分类的,也可以是连续型变量和有序多分类变量,也可以是连

41、续型变量和有序多分类变量,但无序多分类变量应用一组亚元变量取代。但无序多分类变量应用一组亚元变量取代。逐步回归是寻找主要影响因素的回归策略,逐步回归是寻找主要影响因素的回归策略,没有进入模型的变量不能作推断。没有进入模型的变量不能作推断。79Logistic 回归模型回归模型 模型中出现有交互作用,不是统计模型中出现有交互作用,不是统计分析的最终结果,只是中间结果,分析的最终结果,只是中间结果,一般要根据研究目的进行简单效应一般要根据研究目的进行简单效应分析。分析。条件条件Logistic模型只适用于配对病例模型只适用于配对病例对照研究,其回归系数解释与非条对照研究,其回归系数解释与非条件的件

42、的Logistic模型相同。模型相同。80Logistic 回归模型回归模型 病例对照研究的资料可以用病例对照研究的资料可以用Logistic回归模型回归模型分析暴露因素与应变量之间的关联性,但不分析暴露因素与应变量之间的关联性,但不可以直接应用可以直接应用Logistic模型进行预测或估计患模型进行预测或估计患病率。病率。Logistic回归模型在拟合的过程中经常会提到回归模型在拟合的过程中经常会提到拟合优度拟合优度(goodness of fiting)的问题的问题,拟合优度拟合优度没有统计学意义,只说明当前在模型中的变没有统计学意义,只说明当前在模型中的变量情况下,该模型与最优模型无统计学差异,量情况下,该模型与最优模型无统计学差异,但不能说明模型中再增加变量的情况。但不能说明模型中再增加变量的情况。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!