第三讲-MATLAB预测(1)回归分析

上传人:每**** 文档编号:47299670 上传时间:2021-12-18 格式:PPT 页数:21 大小:509KB
收藏 版权申诉 举报 下载
第三讲-MATLAB预测(1)回归分析_第1页
第1页 / 共21页
第三讲-MATLAB预测(1)回归分析_第2页
第2页 / 共21页
第三讲-MATLAB预测(1)回归分析_第3页
第3页 / 共21页
资源描述:

《第三讲-MATLAB预测(1)回归分析》由会员分享,可在线阅读,更多相关《第三讲-MATLAB预测(1)回归分析(21页珍藏版)》请在装配图网上搜索。

1、2021/5/231先来看两个例子:先来看两个例子: 问题1 (血压与年龄)为了了解血压随着年龄的增长而升高的关系,调查了30个成年人的血压,如表所示,我们希望用这组数确定血压与年龄之间的关系,并且由此从年龄预测血压可能的变化范围。表 1序号血压年龄序号血压年龄序号血压年龄1144391116264211363622154712150562214250313845131405923120394145471411034241202151626515128422516044614246161304826158537170671713545271446381244218114182813029915

2、867191162029125251015456201241930175692021/5/232模型模型:记血压为y,年龄为x,可以做出如上图所示的散点图,从图形上直观的可以看出,y与x大致呈线性关系,即有:01yx需要由数据确定系数 的估计值 。01,01,此函数为一元线性函数!2021/5/233 问题2 (血压与年龄,体重指数,吸烟习惯) 世界卫生组织颁布的“体重指数”的定义是体重(kg)除以身高(m)的平方,下表给出了30个人的体重指数等数据,其中,0表示不吸烟,1表示吸烟,怎么考虑吸烟这个因素,此因素对于血压升高有影响吗,并对体重指数为25,50岁的吸烟者的血压做出预测。表 2序号

3、血压 年龄体重指数吸烟习惯序号 血压 年龄体重指数吸烟习惯序号 血压 年龄体重指数吸烟习惯11443924.20111626428.01211363625.0022154731.11121505625.80221425026.2131384522.60131405927.30231203923.5041454724.01141103420.10241202120.3051626525.91151284221.70251604427.1161424625.10161304822.21261585328.6171706729.51171354527.40271446328.3081244219.7

4、0181141818.80281302922.0191586727.21191162022.60291252525.30101545619.30201241921.50301756927.412021/5/234模型:模型:记血压为 ,年龄为 ,体重指数为 ,吸烟习惯为 ,用Matlab将 与 的数据做散点图,看出大致也呈线性关系,建立模型:y1x2x3xy2x01 12233yxxx由数据估计系数 ,也可看做曲面拟合(其实为超平面)0234, , ,2021/5/235多元线性回归多元线性回归 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.12122221112

5、11nYYYY.21pb.101、确定回归系数的点估计值:确定回归系数的点估计值:ppxxy.110第三讲第三讲 MATLAB预测方法(预测方法(1)回归分析)回归分析2021/5/2363、画出残差及其置信区间:画出残差及其置信区间: rcoplot(r,rint)2、求回归系数的点估计和区间估计、并检验回归模型:求回归系数的点估计和区间估计、并检验回归模型: b, bint,r,rint,stats=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:R2、F值、与F对应的概率p、以及残差的方差的估计值置信区间 显著性水平(缺省时为0.05)20

6、21/5/237问题1的求解:y=;%已知的因变量数组x=;%已知的自变量数组n=;%已知的数据容量X=ones(n,1),x;%1与自变量组成的输入矩阵b,bint,r,rint,s=regress(y,X);%回归分析程序(显著性水平为0.05)b, bint, s,%输出回归系数及其置信区间和统计量 rcoplot(r,rint) %残差及其置信区间作图输出结果为:b=98.40840.9732bint = 78.7484 118.0683 0.5601 1.3864s = 0.4540 23.2834 0.0000 273.71372021/5/238结果整理为下表:R2=0.4540

7、 F=23.2834 p0.001 s2=273.71370.5601 1.38640.973274.7484, 118.068398.4084回归系数置信区间回归系数估计值回归系数01 从以下几点可以看出模型是有效的:参数的置信区间不含0点;p小于显著性水平;用Matlab可以求出F1-(1,n-2)=4.1960,显然小于F值。 但是由于1的置信区间过长,R2较小,说明模型的精度不高!2021/5/239残差图如图所示:图中第二个点的残差置信区间中不包含0点,由于残差服从均值为0的正态分布,因此可以认为这个点为异常数据,偏离数据整体的变化范围,应该剔除,重新进行回归分析!残差与残差区间杠杆

8、图,最好在0点线附近比较均匀的分布,而不呈现一定的规律性,如果是这样,就说明回归分析做得比较理想。2021/5/2310剔除第二个点后得到的结果:R2=0.7123 F=66.8358 p0.0001 s2=91.43050.7140, 1.19250.953385.4771, 108.255996.8665回归系数置信区间回归系数估计值回归系数01对50岁的人血压进行预测,得到结果为:0010096.86650.9533144.5298yxx根据预测区间 ,可以得到其置信度为0.95的置信区间为:125.7887,163.2708.001122,yus yus2021/5/2311同样方法做

9、问题二第一次做多元回归结果:R2=0.6855 F=18.8906 p0.0001 s2=169.7917-0.0758 0.79650.36043.5537 87.173645.3636回归系数置信区间回归系数估计值回归系数013.090611.82461.0530 5.1281-0.1482 23.797323通过残差分析图可以得到第2个点和第10个点为异常点,删除后重新进行回归分析,可以得到下面表:2021/5/2312R2=0.8462 F=44.0087 p0.0001 s2=53.66040.1273 0.73320430329.9064 87.113858.5101回归系数置信区

10、间回归系数估计值回归系数012.344910.30650.8509 3.83893.3878 17.225323用上面的参数通过计算可以得到:50岁,体重指数为25,吸烟的人的血压预测为:148.9525置信度为0.95的置信区间为:134.5951,163.30992021/5/2313多多 项项 式式 回回 归归 (一)一元多项式回归(一)一元多项式回归 (1)确定多项式系数的命令:p,S=polyfit(x,y,m)(2)一元多项式回归命令:polytool(x,y,m)1、回归:、回归:y=a1xm+a2xm-1+amx+am+12、预测和预测误差估计:、预测和预测误差估计:(1)Y=

11、polyval(p,x)求polyfit所得的回归多项式在x处 的预测值Y;(2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y DELTA;alpha缺省时为0.052021/5/2314t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146

12、.48方法一方法一 直接作二次多项式回归:直接作二次多项式回归: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2)1329. 98896.652946.4892tts得回归模型为 :2021/5/2315方法二方法二化为多元线性回归:化为多元线性回归:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.

13、90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,stats22946.4898896.651329. 9tts得回归模型为 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r)预测及作图预测及作图2021/5/2316(二)多元二项式回归(二)多元二项式回归命令:rstool(x,y,model, alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量2021/5/2317 例例2 设某商品的需求量与消费者的平均收入、商品价格的统计

14、数 据如下,建立回归模型,预测平均收入为1000、价格为6时 的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439方法一方法一 直接用多元二项式回归:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y,purequadratic)2021/5/2318 点击画面左下方的Export按钮,

15、则beta、rmse和residuals都传送到Matlab工作区中.在左边图形下方的方框中输入1000,右边图形下方的方框中输入6。 则画面左边的“Predicted Y”下方的数据变为88.47981,即预测出平均收入为1000、价格为6时的商品需求量为88.4791.2021/5/2319在Matlab工作区中输入命令: beta, rmse2021/5/2320结果为: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 0.9702 40.6656 0.0005方法二方法二 2222211122110 xxxxy将 化为多元线性回归:部分资料从网络收集整理而来,供大家参考,感谢您的关注!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!