利用 Matlab作回归分析

上传人:daj****de2 文档编号:121993428 上传时间:2022-07-19 格式:DOCX 页数:16 大小:58.39KB
收藏 版权申诉 举报 下载
利用 Matlab作回归分析_第1页
第1页 / 共16页
利用 Matlab作回归分析_第2页
第2页 / 共16页
利用 Matlab作回归分析_第3页
第3页 / 共16页
资源描述:

《利用 Matlab作回归分析》由会员分享,可在线阅读,更多相关《利用 Matlab作回归分析(16页珍藏版)》请在装配图网上搜索。

1、利用 Matlab 作回归分析一元线性回归模型:y 二 a + px + , N(O,g2)求得经验回归方程:y 二a + p x统计量:总偏差平方和:SST = 丫 (y -刃2,其自由度为f二n -1 ; iTi=1回归平方和:SSR二工(y - y )2,其自由度为f = 1 ;iRi=1残差平方和:SSE =工(y -y )2,其自由度为f = n-2 ;i iEi=1它们之间有关系: SST=SSR+SSE。一元回归分析的相关数学理论可以参见概率论与数理统计教 程,下面仅以示例说明如何利用Mat lab作回归分析。【例1】为了了解百货商店销售额X与流通费率(反映商业活动 的一个质量指

2、标,指每元商品流转额所分摊的流通费用)y之间 的关系,收集了九个商店的有关数据,见下表 1.试建立流通费 率 y 与销售额 x 的回归方程。表 1 销售额与流通费率数据样本点销售额x(万元)流通费率y11.57.024.54.837.53.6410.53.1513.52.7616.52.5719.52.4822.52.3925.52.2【分析】:首先绘制散点图以直观地选择拟合曲线,这项工作可 结合相关专业领域的知识和经验进行,有时可能需要多种尝试。 选定目标函数后进行线性化变换,针对变换后的线性目标函数 进行回归建模与评价,然后还原为非线性回归方程。【Matlab 数据处理】:【Stepi】:

3、绘制散点图以直观地选择拟合曲线x=1.5 4.5 7.5 10.5 13.5 16.5 19.5 22.5 25.5;y=7.0 4.8 3.6 3.1 2.7 2.5 2.4 2.3 2.2; plot(x,y,-o)输出图形见图 1 。图 1 销售额与流通费率数据散点图根据图 1,初步判断应以幂函数曲线为拟合目标,即选择非 线性回归模型,目标函数为:y 二 axb (b F)q 0 ;模型方差的估计值.2 - SE - 0.0012。n-2【注】:严格来讲,模型评价工作应在逆线性化变换后进行;但 是,若所建立的线性回归方程不理想,则相应的非线性回归方 程必定不理想。【Step3】:拟线性化

4、变换求非线性回归方程(若选择为非线性 模型)% 逆线性化变换A=exp(b(1)B=b(2)运行结果为: A = 8.5173; B =-0.4259。即非线性回归方程为:y - 8.5173x-0.4259 。多元回归模型多元线性回归模型(p1):y =卩 + 卩 x + 卩 x H卩 x + 8 , 8 口 N(0Q 2)0 1 1 2 2 p p 求得经验回归方程:y =卩+卩x +卩x H卩x0 1 1 2 2 p p 统计量:总偏差平方和:SST =工(y - y)2,其自由度为f = n -1 ;iTi=1回归平方和:SSR =工(y -y)2,其自由度为f = p ;iRi=1残

5、差平方和:SSE =(y -y )2,其自由度为f = n-p-1 ;i iEi=1它们之间有关系: SST=SSR+SSE。 多元回归分析的相关数学理论可以参见多元数据分析,下面 仅以示例说明如何利用Mat lab作多元回归分析。【例 2】参见教材 P294: 10.1 牙膏的销售量。下面只描述运行程序的过程,应该按照规定格式书写报告】。符号说明:x :表示价格差;1x :广告费用;2y :销售量。【Stepi】:绘制散点图以直观地选择拟合曲线 clear x1=-0.05 0.25 0.60 0 0.25 0.20 0.15 0.05 -0.15 0.15 0.20 0.10 0.40 0

6、.45 0.35 0.30 0.50 0.50 0.40 -0.05 -0.05 -0.10 0.20 0.10 0.50 0.60 -0.05 0 0.05 0.55;x2=5.50 6.75 7.25 5.50 7.00 6.50 6.75 5.25 5.25 6.00 6.506.25 7.00 6.90 6.80 6.80 7.10 7.00 6.80 6.50 6.25 6.00 6.507.00 6.80 6.80 6.50 5.75 5.80 6.80;y=7.38 8.51 9.52 7.50 9.33 8.28 8.75 7.87 7.10 8.00 7.898.15 9.1

7、0 8.86 8.90 8.87 9.26 9.00 8.75 7.95 7.65 7.27 8.008.50 8.75 9.21 8.27 7.67 7.93 9.26;h1=figure;plot(x1,y,+);h2=figure;plot(x2,y,o);图1 y对x1的散点图75109.598.587.55.566.5y77.5图2x2的散点图分析图 1 ,可以发现,随着 x1的增加,y的值有比较明显的线性增长趋势; 分析图2,当x增大时,y有向上弯曲的趋势,可用二次多项式进行逼近;因此可以选择如下方程作为初步的回归模型:y =卩 +卩 x +卩 x +卩 x2 + , N(u,Q

8、2)0 1 1 2 2 3 2【Step2】:模型求解(理论方法:最小二乘法)alpha=0.05;v二ones(leng th(x1),1) x1 x2(x2.八2);b,bint,r,rint,stats=regress(y,v,alpha)计算结果:b = 17.3244 1.3070 -3.6956 0.3486bint =5.728228.92060.68291.9311-7.49890.10770.03790.6594r = -0.0988-0.0795-0.1195-0.04410.4660-0.0133 0.2912 0.2735-0.23510.1031-0.40330.17

9、470.0400-0.1504 0.1284 0.1637-0.0527-0.1907-00870-0.0165-0.1292-0.3002 -0.2933 -0.1679-0.21770.1116030350.06930.24740.2270rint =-.52700.3294;-0.53090.3718;-0.5106 0.2716;-0.47310.3848;0.08130.8507;-0.46090.4343;-0.1374 0.7197; -0.0870 0.6340; -0.59600.1258;-0.3280 0.5341; -0.81900.6112;-0.40320.4832

10、; -0.59330.5775;-0.28410.6116; -0.48300.2434;-0.53480.3609; -0.44230.3024;-0.71810.1177; -0.72430.2190;-0.64490.2095; -0.29940.7106;-0.37140.5099; -0.18070.64300.0125; -0.26180.2925; -0.32070.3776; -0.62480.4092; -0.56090.1377; -0.55480.5226; -0.10370.6755; -0.1890stats = 0.9054 82.9409 0.0000 0.049

11、0【St ep3】结果分析回归模型为:y 二 17.3244+1.3070x -3.6959x + 0.3486x2122从结果数据来看,模型整体可用。但也有缺陷,可以改进【St ep4】销售量的预测设需要预测的点为:x = (x ,x ,,x ),0 01 02 0 p则预测值为y = P + 卩 x + 卩 x H卩 x0 0 1 01 2 02 p 0 p *2 =E,A= ;1 + + n - p -1nni=1 j=1(x x)(x x )c , x =- x0ii0 jj ij i n kik=1(c) = (XT X)-1,ij Px P则在 x 处的区间预测为 0(y -1 _

12、 (n - p - 1)d *A , y +1 _ (n - p - 1)d *A)0(1-a)0(1-a)模型改进】:当两个因素是不独立时,引入交叉项 x x ,新的12回归模型为y = P + P x + P x + P x2 + P x x + 0 11 2 2 3 2 412alpha=0.05;v二ones(leng th(x1),1) x1 x2(x2.八2)(x1.*x2);b,bint,r,rint,stats=regress(y,v,alpha)输出结果:b = 29.1133 11.1342 -7.6080 0.6712 -1.4777 bint =13.701344.52

13、52;1.977820.2906;-12.6932 -2.5228; 0.2538 1.0887; -2.8518-0.1037r = -0.0441; -0.1229; 0.0299; -0.0745;0.3841;-0.0472;0.2331;0.0287;-0.0661;0.0297;-0.4372;0.1763;0.0356;-0.1382;0.1027;0.1270;0.0048;-0.1435;-0.1016;0.0050;-0.0389;-0.1334;-0.3272;-0.3274;-0.2102;0.1412;0.3250;0.1096;0.2342;0.2455rint =

14、 -0.4425 0.3542; -0.5408 0.2951;-0.31010.3698;-0.47360.3247;0.02450.7437;-0.46400.3695;-0.16740.6337;-0.23690.2943;-0.37510.2430;-0.36910.4284;-0.8118-0.0627;-0.23060.5832;-0.37880.4499;-0.55210.2757;-0.31720.5226;-0.29170.5456;-0.39440.4039;-0.54900.2621;-0.51930.3160;-0.39260.4026;-0.43600.3582;-0

15、.50450.2378;-0.72120.0667;-0.6326-0.0221;-0.60850.1881;-0.23980.5223;-0.04840.6984;-0.29880.5181;-0.16500.6335;-0.13910.6302stats = 0.9209 72.7771 0.0000 0.0426结果分析:效果更好。逐步回归方法要点:【Stepi】根据问题所属专业领域的理论和经验提出对因变量可 能有影响的所有自变量;【St ep2】计算每一个自变量对因变量的相关系数,按其绝对值 从大到小排序;【St ep3】取相关系数绝对值最大的那个自变量建立一元线性回归模型,检验所得回

16、归方程的显著性,若检验表明回归效果则转 入【Step4】,若检验表明回归效果不显著则停止建模;【St ep4】进行变量的追加、剔除和回归方程的更新操作。Matl ab 命令:【命令1 】:stepwisefit【调用格式】:b,se,pval,inmodel,stats,nextstep,history=stepwisef it(x,y, param1 ,value1, param2,value2, )【参数说明】:X: p个自变量的n个观测值的nxp矩阵;Y:因变量的n个观测值的n x 1矩阵;penter:设置回归方程显著性检验的显著性概率上限,缺 省值为0.05;premove:设置回归

17、方程显著性检验的显著性概率下限, 缺省值为0.10;display用来指明是否强制显示建模过程信息,取值为 on(显示,缺省设置)和off (不显示)。例 4:某种水泥在凝固时放出的热量 ( 单位:卡/ 克 )Y 与水泥 中的四种化学成分所占的百分比有关,现测得13 组数据如下表:编号X1X2X3X4Y172666078.52129155274.331156820104.34113184787.6575263395.961155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.

18、3131068812109.4作回归分析。【Ma tl ab程序】clear clc load haldb,se,pval,inmodel,stats,nextstep,history=stepwisefit( ingredients,heat,penter,0.10,display,off);% 自变量的筛选和模型参数估计信息inmodel,b0=stats.intercept,b% 回归方程显著性整体检验信息Allp=stats.pval,rmse=stats.rmse% 回归方程显著性分别检验信息P=stats.PVAL输出结果:inmodel = 1 1 00;b0 = 52.5773

19、;b = 1.4683 0.66230.2500 -0.2365 ;Allp = 4.4066e-009;rmse =2.4063;P = 0.0000 0.0000 0.20890.2054 。结果分析:最优回归方程为y 52.5773 + 1.4683x + 0.6623x, 回归方程显著性12整体检验和分别检验均为高度显著,模型标准误差估计为2.4063。【命令2】:stepwise调用格式】:stepwise(x,y,inmodel,penter,premove)【说明】:创建多元线性回归分析的逐步回归法建模的交互式图 形环境。【图形界面说明】:窗口1: Coefficients wi

20、th error Bars绘出各个解释变量回归系数的估计,圆点表示点估计值,横线表示置信区间(有色线段表示90%置信区间,黑色线段表 示95%置信区间)。窗口的右侧给出回归系数的点估计值(Coeff)、显著性检验的t统计量的值(t-test)和显著性概率p值(p-val).窗口2: Model History该窗口绘出的圆点表示历次建模的模型标准差o的估计。两个窗口中间输出的是当前模型的有关信息,包括:Int erce p t :模型截距(常数项)的估计;RMSE:模型标准差o的估计;R-square :可决系数;Adj-R-sq :校正可决系数;F:模型整体性检验的F统计量的值;p:模型整体性检验的显著性概率。窗口 I右侧的三个按钮:Next St ep:在回归方程中按相关系数绝对值大小逐次引入解释变量,如无解释变量可引入时,按钮不可用;AllSteps:直接给出“只进不出”方式建模的最终结果(注意,此时的回归方程未必是最优回归方程);Expor t:选择向Workspace传输的计算结果(有关变量名可由用户自定义)stepwise(ingredients,heat,1 1 1 1,0.05,0.10);

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!