各种回归模型适用条件,logistic回归

上传人:仙*** 文档编号:54847978 上传时间:2022-02-15 格式:PPT 页数:40 大小:167.52KB
收藏 版权申诉 举报 下载
各种回归模型适用条件,logistic回归_第1页
第1页 / 共40页
各种回归模型适用条件,logistic回归_第2页
第2页 / 共40页
各种回归模型适用条件,logistic回归_第3页
第3页 / 共40页
资源描述:

《各种回归模型适用条件,logistic回归》由会员分享,可在线阅读,更多相关《各种回归模型适用条件,logistic回归(40页珍藏版)》请在装配图网上搜索。

1、LOGISTIC 回归回归线性模型线性模型一般线性模型一般线性模型线性回归线性回归方差分析方差分析协方差分析协方差分析响应变量响应变量连续,正态连续,正态连续,正态连续,正态连续,正态连续,正态解释变量解释变量连续连续离散离散连续和离散连续和离散连接函数连接函数恒等式恒等式恒等式恒等式恒等式恒等式SAS实现实现REG/GLMMIXEDANOVA /MIXED GLM / GENMOD GLM / MIXEDGENMOD 线性模型线性模型广义线性模型广义线性模型logistic回归回归对数线性模型对数线性模型响应变量响应变量离散型,离散型, B(n,)事件发生频数事件发生频数解释变量解释变量离散

2、型,连续型离散型,连续型分类变量分类变量联接函数联接函数logit lnP/(1-P)log线性模型的条件线性模型的条件 LINE L Linear I Independence N Normal distribution E Equal varianceLOGISTIC 模型模型 二值变量(二值变量(0,1)资料的)资料的logit变换变换 设设P为事件发生的概率为事件发生的概率PPP1ln)(logitx0)(logPit事件发生的优势事件发生的优势odds和和样本率的关系样本率的关系P1.00.90.80.70.60.50.40.30.20.10.00Value ODDS P/(1-P)

3、20151050图图图图图图 1 1 1 事件发生的优势事件发生的优势事件发生的优势事件发生的优势事件发生的优势事件发生的优势oddsoddsodds和样本率的关系和样本率的关系和样本率的关系和样本率的关系和样本率的关系和样本率的关系图图图 2 logit2 logit2 logit 函数图函数图函数图图图 2 logit 函数图函数图P1.00.95.85.75.65.55.45.35.25.15.05.00Value LOGITP6420-2-4-66420-2-4-6u(x)P1.0.8.6.4.20.0图图图 3 logistic3 logistic3 logistic曲线曲线曲线x0

4、)(xuxx001eeP例例1. 饮酒与高血压饮酒与高血压年龄组年龄组25357585高血压高血压+饮饮 +酒酒 194265001065164831Data a;Data a;Input y drink a1 a2 a3 a4 a5 count;Input y drink a1 a2 a3 a4 a5 count;Cards;Cards;1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 01 1 0 0 0 0 0 1 1 0 0 0 0 0 0 01 1 1 0 0 0 0 4 1 0 1 0 0 0 0 51 1 1 0 0 0 0 4 1 0 1 0 0 0 0 51 1 0

5、 1 0 0 0 25 1 0 0 1 0 0 0 211 1 0 1 0 0 0 25 1 0 0 1 0 0 0 211 1 0 0 1 0 0 42 1 0 0 0 1 0 0 341 1 0 0 1 0 0 42 1 0 0 0 1 0 0 341 1 0 0 0 1 0 19 1 0 0 0 0 1 0 361 1 0 0 0 1 0 19 1 0 0 0 0 1 0 361 1 0 0 0 0 1 5 1 0 0 0 0 0 1 81 1 0 0 0 0 1 5 1 0 0 0 0 0 1 80 1 0 0 0 0 0 9 0 0 0 0 0 0 0 1060 1 0 0 0 0

6、0 9 0 0 0 0 0 0 0 1060 1 1 0 0 0 0 26 0 0 1 0 0 0 0 1640 1 1 0 0 0 0 26 0 0 1 0 0 0 0 1640 1 0 1 0 0 0 29 0 0 0 1 0 0 0 1380 1 0 1 0 0 0 29 0 0 0 1 0 0 0 1380 1 0 0 1 0 0 27 0 0 0 0 1 0 0 1380 1 0 0 1 0 0 27 0 0 0 0 1 0 0 1380 1 0 0 0 1 0 18 0 0 0 0 0 1 0 880 1 0 0 0 1 0 18 0 0 0 0 0 1 0 880 1 0 0 0

7、 0 1 0 0 0 0 0 0 0 1 310 1 0 0 0 0 1 0 0 0 0 0 0 0 1 31; ;proc logistic descending;proc logistic descending;freq count;freq count;model y=a1 a2 a3 a4 a5 drink;model y=a1 a2 a3 a4 a5 drink;run;run;SAS 程序1例1 SAS结果解释-变量赋值 Response Profile Ordered Total Value y Frequency 1 1 200 2 0 774 Probability mode

8、led is y=1.模型中假(哑)变量的定义问题模型中假(哑)变量的定义问题年龄组年龄组25354555657585Age123456a1010000a2001000a3000100a4000010a5000001模型中假变量的向量表示模型中假变量的向量表示 或),(54321aaaaaA54321aaaaaA参数估计及模型检验参数估计及模型检验 最大似然法:使似然函数最大似然法:使似然函数L达到最大。达到最大。 拟合优度检验:拟合优度检验: H0:模型拟合观察资料;模型拟合观察资料; H1:模型不拟合观察资料。模型不拟合观察资料。 拟合优度检验统计量:拟合优度检验统计量: -2ln(L)

9、在大样本条件下近似服从在大样本条件下近似服从=N-m-1的的2分布分布 变量筛选变量筛选 似然比检验(最常用)似然比检验(最常用) 记分检验记分检验: 统计量:统计量:SCORE (公式略)(公式略) Wald检验检验1)ln2(ln2DFLLG 122DFSEiii例例1 模型检验统计量模型检验统计量 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 991.029 802.456 SC 995.910 836.626 -2 Log L 989.029 788.456例例1 模型检验结果模型检

10、验结果Testing Global Null Hypothesis: BETA=0Test Chi-Square DF Pr ChiSqLikelihood Ratio 200.5731 6 .0001 Score 183.5523 6 .0001 Wald 125.0228 6 ChiSqIntercept 1 -5.0534 1.0094 25.0637 .0001 a1 1 1.5426 1.0659 2.0944 0.1478 a2 1 3.1990 1.0231 9.7763 0.0018 a3 1 3.7182 1.0185 13.3264 0.0003 a4 1 3.9667 1

11、.0230 15.0337 0.0001 a5 1 3.9616 1.0650 13.8375 0.0002 drink 1 1.6671 0.1896 77.2908 ChiSq Ratio x1 1 0.78547 0.25686 9.3513 0.0022 2.193 x2 1 0.81411 0.30679 7.0420 0.0080 2.257例例2 条件条件logistic sas结果结果变量筛选变量筛选Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 22.001

12、7 2 ChiSq Ratiox1 1 0.82351 0.26700 9.5130 0.0020 2.278x2 1 0.82561 0.31141 7.0290 0.0080 2.283x3 1 0.49890 0.51744 0.9296 0.3350 1.647有序多分类有序多分类logistic模型模型 累积累积logistic模型:模型: 设结果变量设结果变量y有有c个等级,个等级, 如如 1显效;显效;2有效;有效;3无效无效 则用则用c-1个方程描述个方程描述y与与x的关系的关系1,.,2 , 1)|(logckkyPitkxx累累积积模模型型程程序序3 data a; inp

13、ut y x1 x2 count; cards; 1 1 1 16 1 0 1 5 2 1 1 5 2 0 1 2 3 1 1 6 3 0 1 7 1 1 0 6 1 0 0 1 2 1 0 7 2 0 0 0 3 1 0 19 3 0 0 10 ; proc logistic; freq count; model y= x1 x2/scale=none aggregate; run;X1 性别性别 x2 方法方法 y 疗效:疗效: 1 显效显效 2 有效有效 3无效无效有序多分类有序多分类变量赋值变量赋值Response ProfileOrdered TotalValue y Frequen

14、cy1 1 282 2 143 3 42累积累积logistic模型参数估计例模型参数估计例Analysis of Maximum Likelihood Estimates Standard WaldParameter DF Estimate Error Chi-Sq Pr ChiSqIntercept 1 1 -2.6671 0.5997 19.7800 .0001Intercept 2 1 -1.8127 0.5566 10.6064 0.0011 x1 1 1.3187 0.5292 6.2096 0.0127 x2 1 1.7973 0.4728 14.4493 0.0001X1 性别

15、性别 x2 方法方法 y 疗效:疗效: 1 显效显效 2 有效有效 3无效无效两个方程LogitP(Y=1|x=-2.667+1.318x1+1.797x2LogitP(Y=2|x=-1.813+1.318x1+1.797x2 问一女性病人使用新疗法的预期疗效?问一女性病人使用新疗法的预期疗效? 将将x1=1 x2=1代入方程代入方程 得得 LogitP(Y=1|x)=0.448 LogitP(Y=2|x)=1.302 P(Y=1|x)=0.61 P(Y ChiSqIntercept 1 -0.9826 0.5707 2.96 0.0851 2 - 0 . 3 4 6 1 0 . 5 4 1

16、3 0.41 0.5226x1 1 0.6281 0.1799 12.19 0.0005 2 0 . 3 4 5 4 0 . 1 7 2 8 4.00 0.0456x2 1 -0.6494 0.2833 5.26 0.0219 2 - 0 . 6 3 5 2 0 . 2 7 2 5 5.43 0.0197Logistic 模型的应用和问题模型的应用和问题 应用应用筛选危险因素筛选危险因素 / 校正混杂因素校正混杂因素 / 预测与判别预测与判别 问题问题1 样本量不能太小样本量不能太小2 不应单纯依赖程序筛选变量,注意变量的医学意义不应单纯依赖程序筛选变量,注意变量的医学意义3 自变量的类型和参数意义的解释问题自变量的类型和参数意义的解释问题4 多数情况下,模型常数项没有意义多数情况下,模型常数项没有意义5 条件条件logistic模型不能用于预测模型不能用于预测

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!