《多元回归分析》PPT课件.ppt
《《多元回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多元回归分析》PPT课件.ppt(31页珍藏版)》请在装配图网上搜索。
六西格玛绿带培训教材多元回归分析,12-1,结束对本章节的学习后,学员将可以:解释什么是多项式回归和多元回归进行多项式回归分析进行多元回归分析,学习目的,定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(X1,X2,.Xn),回归分析,其中:,Y是响应变量,X1到Xn是因变量,12-2,定义:决定两个来自不同变量根源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1R1。按照惯例,R表示真实的系数,R表示我们的最佳估算。,相关,回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式(公式)。,回归与相关,12-3,相关分析量华两个变量之间的线性关系的程度,即等式的适合性如何?,VS,预测系统模型因子筛选参数估算,回归的应用,在前一节,我们讲解了一般线性回归方法。但是,常常会遇到响应量Y与因变量X之间的关系并非线性的情况。可能是平方或立方的关系。,多项式回归,这种情况下,一般线性回归模式就不是一个好的选择。模型可能是:Y=a+b1x+b2x2+b3x3,12-4,多项式回归模型是带有更高次方因变量的一般线性回归模式的另外一种形式。对于多项式模型是否适用于分析响应变量的变异,“残差与拟合值”和“残差与因变量”图可以提供提示。这些图中的曲线部分通常表示多项式模型对于响应变量能够提供一个更好的拟合。,多项式回归,一组实验要研究高强度水泥中的各种杨灰含量对水泥强度的影响,在0到60%的不同扬灰含量下获得18个水泥样本。数据在Concretestrength.mtw,例1,12-5,建立一次,二次和三次回归模型,并进行对比。,Minitab:统计回归拟合线图,例1A.一次模型,Minitab:统计回归拟合线图,例1B.二次模型,12-6,例1B.二次模型,例1C.三次模型,12-7,多项式回归是否产生更好的拟合?,以更高次的因变量拟合响应变量总是会改善测定系数。但是,这也伴随着自由度降低的代价。为了比较高次方模型是否会提供较佳的拟合,可以做如下两种其它比较方法:a)修正测定系数(R2调修正)b)估计值的标准误,例1D,模式比较,12-9,ModelAdjR2SLinear13.2%460.8Quadratic60.2%312.1Cubic85.3%189.4,问题:哪一个是最佳拟合模型?,多元线性回归,12-9,如果我们怀疑/知道多个变量与响应变量Y有关,我们可建立一个多元回归模型.使用两个或多个输入变量如X1、X2等,模型将变得很复杂,但他们可能产生更有用的信息,且比较单变量模型提供更精确的预测。,12-10,一般线性回归,一般线性回归模型,Y是响应,Bis是回归系数,Y=a+b1x1+b2x2+b3x3+bkxk,Xis是预测因子,a)k=1:一般线性回归或一般回归b)k1:多元性回归或多元回归,Xs可以是高次方多项式项,不同的变量,或不同变量的交叉项(例如X3=X1*X2),多元回归,12-10,当需要考虑超过一个预测因子时,多元回归分析可以看作是一般回归分析(其中只含有一个预测因子)的扩展。在当今的工艺技术中,很难找到单一响应变量单一预测因子的模型。因以下的原因:多元回归比一般回归分析更加困难:最佳模型的选定模型拟合的直观度对拟合模型的理解对拟合模型的计算,如何选择最佳模型,12-11,选择标准残差均方(MSEp)测定系数(R2)修正的测定系数,例2:多元回归,数据在MultiReg.mtwy=化学溶液的杂质百分数x1=温度()x2=杀菌时间(分),12-13,例2:多元回归,我们的目标是建立回归模型,然后预测当时间为15分,温度为120,及使用它预测平均杂质百分数。方法:建议使用模型运行回归程序,包含所有模型的检验程序当模型被确认使用后,使用/解释该模型。,例2:与时间对应的杂质百分数,12-14,例2:与温度对应的杂质百分数,例2:尝试线性模型,12-15,例2:尝试线性模型,例2:Minitab输出,回归分析:%lmp与Time,Temp回归方程为%lmp=2.74+0.0503Time-0.0147Temp自变量系数系数标准误TP常量2.74000.194414.090.000Time0.0503330.0090415.570.000Temp-0.0146500.001107-13.230.000S=0.0782949R-Sq=95.8%R-Sq(调整)=94.9%,在其他变量都被包含在模型内的情况下,每一个变量都显著,模型包括了94.9%变异,12-16,例2:Minitab输出(续),方差分析来源自由度SSMSFP回归21.263120.63156103.030.000残差误差90.055170.00613合计111.31829来源自由度SeqSSTime10.19001Temp11.07311新观测值的预测值新观拟合值测值拟合值标准误95%置信区间95%预测区间11.73700.0389(1.6490,1.8250)(1.5392,1.9348)新观测值TimeTemp115.0120,94.9%是显著的,总方差SST=1.31829,它的1.07311是基于温度,另外的0.19001是基于时间,当温度为1200,时间为15分时,平均杂质百分比预测是1.7370,例2:残差分析,三个残差图被检验(紧接三张幻灯片)相对时间残差相对温度残差相对拟合值残差残差图显示模型没问题,12-17,相关变量问题,在多元回归里,如果输入变量X1、X2等是不相关,分析比变量相关时更一般。通常在设计实验里,跟这些例子的情况一样,变量是不相关或几乎不相关。在此事例,相关系数X1、X2=0,我们有R2(adj)=94.9%的y=2.74-0.147X1+0.0503X2,非相关变量-加和R2S,回归分析:%lmp与Temp回归方程为%lmp=3.62-0.0147Temp自变量系数系数标准误TP常量3.62080.226016.020.000Temp-0.0146500.002214-6.620.000S=0.156582R-Sq=81.4%R-Sq(调整)=79.5%只考虑X2的回归方程:%lmp=3.62-0.0147TempwithR2=79.5%只考虑X2的回归方程:y=1.40+.0433X2withR2=5.9%lmp=1.28+0.0503Time,R2=5.9%X1,X2系数不变单个R2值相加为95.8%,等于组合R2,当输入变量相关时这种情况不会发生,12-18,练习-多元回归,用刚才的例子,用MINITAB做多元回归:回归分析:模式诊断(R-Sq,失拟度,残差分析,相关分折);预测时间为30,温度为105的输出变量的平均值.,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元回归分析 多元 回归 分析 PPT 课件
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文