数学建模——线性回归分析

上传人:英*** 文档编号:98588916 上传时间:2022-05-30 格式:PPTX 页数:82 大小:915.77KB
收藏 版权申诉 举报 下载
数学建模——线性回归分析_第1页
第1页 / 共82页
数学建模——线性回归分析_第2页
第2页 / 共82页
数学建模——线性回归分析_第3页
第3页 / 共82页
资源描述:

《数学建模——线性回归分析》由会员分享,可在线阅读,更多相关《数学建模——线性回归分析(82页珍藏版)》请在装配图网上搜索。

1、数学建模数学建模线性回归分析线性回归分析第1页/共81页表1 各机组出力方案 (单位:兆瓦,记作MW)方案方案机组机组123 4 5 6780120731808012512581.1901133.02731808012512581.1902129.63731808012512581.1903158.77731808012512581.1904145.32731808012512581.190512078.5961808012512581.190612075.451808012512581.190712090.4871808012512581.190812083.8481808012512581

2、.190912073231.398012512581.1901012073198.488012512581.1901112073212.648012512581.1901212073190.558012512581.190131207318075.85712512581.190141207318065.95812512581.190151207318087.25812512581.190161207318097.82412512581.190171207318080150.7112581.190第2页/共81页181207318080141.5812581.190191207318080132

3、.3712581.190201207318080156.9312581.190211207318080125138.8881.190221207318080125131.2181.190231207318080125141.7181.190241207318080125149.2981.19025120731808012512560.5829026120731808012512570.9629027120731808012512564.8549028120731808012512575.5299029120731808012512581.1104.8430120731808012512581.

4、1111.2231120731808012512581.198.09232120731808012512581.1120.44第3页/共81页表2 各线路的潮流值(各方案与表1相对应,单位:MW)方案方案线路线路1234560164.78140.87-144.25119.09135.44157.691165.81140.13-145.14118.63135.37160.762165.51140.25-144.92118.7135.33159.983167.93138.71-146.91117.72135.41166.814166.79139.45-145.92118.13135.41163.6

5、45164.94141.5-143.84118.43136.72157.226164.8141.13-144.07118.82136.02157.57165.59143.03-143.16117.24139.66156.598165.21142.28-143.49117.96137.98156.969167.43140.82-152.26129.58132.04153.610165.71140.82-147.08122.85134.21156.2311166.45140.82-149.33125.75133.28155.0912165.23140.85-145.82121.16134.7515

6、6.7713164.23140.73-144.18119.12135.57157.214163.04140.34-144.03119.31135.97156.3115165.54141.1-144.32118.84135.06158.26第4页/共81页24167.69138.07-144.14119.19137.11157.6525162.21141.21-144.13116.03135.5154.2626163.54141-144.16117.56135.44155.9327162.7141.14-144.21116.74135.4154.8828164.06140.94-144.1811

7、8.24135.4156.6829164.66142.27-147.2120.21135.28157.6530164.7142.94-148.45120.68135.16157.6331164.67141.56-145.88119.68135.29157.6132164.69143.84-150.34121.34135.12157.6416166.88141.4-144.34118.67134.67159.2817164.07143.03-140.97118.75133.75158.8318164.27142.29-142.15118.85134.27158.3719164.57141.44-

8、143.3119134.88158.0120163.89143.61-140.25118.64133.28159.1221166.35139.29-144.2119.1136.33157.5922165.54140.14-144.19119.09135.81157.6723166.75138.95-144.17119.15136.55157.59第5页/共81页1、模型的分析第6页/共81页第7页/共81页1266, ,l llL L设设 条条主主要要线线路路有有功功潮潮流流为为1288,x xxL L台台机机组组出出力力分分别别为为则则801,iiijjjlaa x L L i=1,2, ,

9、6 i=1,2, ,6ija其其中中,是是待待确确定定的的系系数数。第8页/共81页第9页/共81页18,ilxxL L为为了了确确定定 和和之之间间是是否否有有线线性性关关系系, 在许多国际国内数学建模竞赛中,都有可能用到回归分析。因此,我们介绍线性回归分析的基本原理,对模型好坏的评价指标,可线性化的回归分析,利用统计软件的实现等具体问题。第10页/共81页第11页/共81页01yx (1 1)012,(0,)N其其中中x x是是自自变变量量,y y是是因因变变量量,为为未未知知的的待待定定常常数数,称称为为回回归归系系数数, 是是随随机机误误差差,且且假假设设。1122(,),(,),(,

10、)nnxyxyxy对对( (x x, ,y y) )的的一一组组观观察察值值011 2iiiyxin , ,满足212,(0,)niN L:L:其其中中相相互互独独立立,且且。第12页/共81页0101,ii L L 如如何何根根据据样样本本观观察察值值( (x x , ,y y ) )( (i i= =1 1, , ,n n) )来来求求的的估估计计值值?01220101,11()min()nniiiiiiyxyx 0101, 通通常常采采用用最最小小二二乘乘估估计计来来做做,也也即即选选取取的的估估计计值值使使其其随随机机误误差差的的平平方方和和达达到到最最小小,即即一元线性回归第13页/

11、共81页201011(,)()niiiQyx 011001112()02()0niiiniiiiQyxQyx x 则令正规方程组一元线性回归第14页/共81页0111201111nniiiinnniiiiiiinxyxxx y (2 2)一元线性回归第15页/共81页1111,nniiiixxyynn 0111122211()()()nniiiiiinniiiiyxx ynxyxxyyxnxxx (3 3)参数的最小二乘估计一元线性回归第16页/共81页211() ,()(),nnxxixyiiiixxLxxyy记记 L L则则有有如如下下结结论论01 yx而而 称作y关于x的一元经验回归方程

12、。22001(1)(,();xxxNnL : :一元线性回归第17页/共81页211201(2)(,);(3)(,)xxxxNLxCovL : :0101,显显然然,分分别别是是,的的无无偏偏估估计计量量。一元线性回归第18页/共81页01iiyx记记 2 下下面面来来求求的的估估计计。,iiiyyx 称称为为 的的残残差差2201211()()22nniiiiiiyyyxnn 令令 ( ( 4)4)22则则是是的的无无偏偏估估计计量量。一元线性回归第19页/共81页201,n L L是是未未知知参参数数。011nnyxx (5 5)2(0,),N 其其中中12,12,(1, )(, )nii

13、ipipxxxyinx xxy LLLLLL设设()是是的的 个个观观察察值值,满满足足第20页/共81页1011121211201212222201122ppppnnnpnpnyxxxyxxxyxxx ( (6)6)2(0,),1,2, .iNin 1nL L其其中中,相相互互独独立立,且且多元线性回归第21页/共81页01,p 12n 12,nyyYy 111212122212(1)11,1ppnnnpnpxxxxxxXxxx 多元线性回归注意:矩阵X的第一列全是1.第22页/共81页YX (7 7)则(6)可用矩阵表达为 选选取取 的的估估计计值值 ,使使得得随随机机误误差差的的平平方方

14、和和达达到到最最小小,即即02011,1() ()min() ()= min()pTTniipipiYXYXYXYXyxx L LL L 多元线性回归第23页/共81页TTX XX Y (8 8)对应正规方程组为 Xm18TX X 在在矩矩阵阵 的的秩秩等等于于,即即列列满满秩秩时时,可可逆逆,正正规规方方程程组组( )有有唯唯一一解解,得得参参数数的的估估计计值值为为1()TTX XX Y 在X不是列满秩时,其解虽然不唯一,但对任意一组解都使得残差平方和最小。多元线性回归第24页/共81页TXX X 即即使使 列列满满秩秩,但但是是行行列列值值很很小小,这这时时正正规规方方程程组组会会变变成

15、成病病态态方方程程,虽虽然然能能求求解解参参数数的的估估计计值值 ,但但是是由由于于误误差差很很大大,无无实实用用价价值值,此此时时称称这这些些变变量量之之间间具具有有多多重重共共线线性性,即即X X的的列列向向量量之之间间有有近近似似的的线线性性关关系系。多元线性回归关于多重共线性的知识请参阅韩中庚数学建模方法及其应用。第25页/共81页22011211()()11nniiiiippiiyyyxxnpnp 2 类类似似地地,可可以以求求的的无无偏偏估估计计多元线性回归第26页/共81页第27页/共81页a、 回归方程的检验; b、 回归系数的检验; c、 回归好坏程度的度量。第28页/共81

16、页12,p 012112:0:,ppHH不不全全为为零零 要检验(6)的变量间有没有这种线性关系,只要检验p个系数第29页/共81页2211()()nniiiiiiSyyyyyy T T0112211,niiiipipiyyyxxxn 为了构造检验统计量,记经验回归方程回归方程的检验第30页/共81页2211()()nniiiiiyyyy 2211()()nneiiiiiSyySyy R R记记 , , TeRSSS则则 回归方程的检验第31页/共81页eS 称称为为残残差差平平方方和和。RS 称称为为回回归归平平方方和和。 它是由随机误差和其他未加控制的因素所引起的误差平方和。回归方程的检验

17、第32页/共81页2212222122()(1),()( )niiiniiyySnpyySp e eR R0H在在成成立立的的条条件件下下,可可以以证证明明eRSS且且与与相相互互独独立立。回归方程的检验第33页/共81页( ,1)1SpFF p npSnp R Re e构造检验统计量为FeS 当当自自变变量量和和因因变变量量之之间间符符合合线线性性回回归归模模型型时时,残残差差平平方方和和比比较较小小,上上述述统统计计量量的的取取值值有有偏偏大大倾倾向向,否否则则, 的的取取值值很很可可能能偏偏小小。回归方程的检验第34页/共81页( ,1)FFp np ( ,1)FFp np 反反之之,若

18、若 相应的检验法则为: 对对事事先先给给定定的的检检验验水水平平 ,若若0H则则拒拒绝绝,即即认认为为各各系系数数不不为为零零,线线性性回回归归方方程程显显著著;0H则则接接受受,即即认认为为各各系系数数都都为为零零,所所假假设设的的线线性性回回归归方方程程不不显显著著;回归方程的检验第35页/共81页01p,HL L在在拒拒绝绝的的情情况况下下,即即认认为为回回归归系系数数,不全为零,但这并不意味着每个自变量1,pXXyL L对对 的的影影响响都都相相同同,其其中中有有的的自自变变量量可能会起重要作用,而有的可能起的作用不大或者不起作用。110Xy 例例如如,若若,则则对对 没没有有影影响响

19、。因此,在通过前面的线性回归模型的检验,1,pyXXL L认认为为 与与符符合合线线性性回回归归模模型型之之后后,回归方程的检验第36页/共81页可有可无的自变量,只保留那些起重要作用的自变量,以从新建立更为简练的线性回归模型,使之有利于实际应用。回归方程的检验第37页/共81页01:0:0(1,2, )jjHHjp检验假设0jHxy原原假假设设未未被被拒拒绝绝,则则表表明明自自变变量量对对 的的作作用用不不显显著著,在在回回归归模模型型中中可可以以去去掉掉。01jHHxy当当拒拒绝绝,即即接接受受,则则表表明明对对 起起作作用用,在在回回归归模模型型中中不不能能去去掉掉。第38页/共81页2

20、(,)nYN XI 121()( ,() )TTTX XX YNX X E ,0,1,jjEjp由(7)所以,jj即即估估计计量量是是的的无无偏偏估估计计量量。回归系数的检验第39页/共81页1 ()TCX X ,2(,)jjjjNc (0,1)jjjjNc 22(1),Snp e e1jjcj 为为C C的的主主对对角角线线上上的的第第个个元元素素,则可以证明jeS 且且与与相相互互独独立立。注意:矩阵C的下标都是从0开始的!回归系数的检验第40页/共81页(1)1jjjeTt npc Snp 2(1),ttnp 0H因因此此,在在成成立立的的件件下下, 对对于于检检验验水水平平 ,若若0j

21、H 则则拒拒绝绝,即即认认为为显显著著的的不不为为零零。回归系数的检验第41页/共81页2(1)ttnp 若若 0jH 则则接接受受,即即认认为为等等于于零零。回归系数的检验第42页/共81页回归系数的检验第43页/共81页 前面说的是剔除变量,也会有变量因素考虑不周的情况,这时应该考虑引入新的变量,那么如何引入新的变量? 对于模型的选择,目前普遍采用的是逐步回归法。也即,每引入一个变量,要进行逐个检验,将不显著的变量剔除。详细情况请参阅韩中庚数学建模方法及其应用第九章。回归系数的检验第44页/共81页第45页/共81页21eRTTSSRSS21SRe e残残差差平平方方和和越越小小,复复相相

22、关关系系数数越越大大,且且0 0。 复相关系数定义为21R 越越接接近近 ,因因变变量量与与自自变变量量之之间间的的线线性性相相关关程程度度越越强强。复相关系数第46页/共81页2111eaTSnpRSn 但是复相关系数也有一些缺点。当采用的自变量2eSR增增多多时时,其其就就会会减减少少,从从而而导导致致增增大大,而而有有些些自变量的引入可能是多余的。为了更准确地反映参数个数的影响,采用调整的2复复相相关关系系数数(adjust Radjust R ), ,其其定定义义如如下下:221aRR与与越越接接近近 ,因因变变量量和和自自变变量量之之间间线线性性相相关关程程度度越越强强。复相关系数第

23、47页/共81页12,pxxxxxxL L01020p01020p所所谓谓预预测测,是是指指当当20012000012,(0,)ppyxxxNyxxxXL:L:L L01020p01020p01020p01020p记记 时对y做区间估计,即以一定的置信度预测y的观察值的取值范围,也即y的预测区间。第48页/共81页20012(,)pyNxxx:L:L01020p01020p01,nyyyL L且且假假设设 与与相相互互独独立立。00,yy 相相互互独独立立,分分别别服服从从正正态态分分布布。001220011(,1()()pppijiijjijyNxxxcxxxxn :L:L01020p010

24、20p 预测第49页/共81页0001111()()ppijiijjijdcxxxxn000(1)1eyyTt npSdnp : :1 对对给给定定的的置置信信度度,有有2000(0,)yyNd : :因而其中此时预测第50页/共81页0000022(1)(1)111eeSSP ytnpdyytnpdnpnp 000022(1),(1)11eeSSytnpdytnpdnpnp1y 0 0即即 的的置置信信度度为为的的置置信信区区间间为为预测第51页/共81页0,xx 显显然然,对对给给定定的的 ,越越靠靠近近样样本本均均值值0y 的的预预测测区区间间长长度度越越小小,预预测测效效果果越越好好。

25、预测第52页/共81页第53页/共81页1bayx可线性化的一元非线性回归模型第54页/共81页,0,0byaxxa可线性化的一元非线性回归模型第55页/共81页,0bxyaea可线性化的一元非线性回归模型第56页/共81页,0bxyaea可线性化的一元非线性回归模型第57页/共81页log ,0yabx x可线性化的一元非线性回归模型第58页/共81页1xyabe 可线性化的一元非线性回归模型第59页/共81页21,(0,)baNyx : :11,uvxy做做变变量量代代换换,则则上上述述模模型型转转化化成成2,(0,)vabuN : :(,)(1,2, ),iiu vin 设有模型线性回归

26、模型:实验数据按上面的变量代换算出可线性化的一元非线性回归模型第60页/共81页2,ln(0,)bxyaeN: :1,ln ,uvyx可可做做变变量量代代换换lnAa 并并记记,则则有有2,(0,)vAbuN : :再按前面的线性回归公式计算参数估计,得1bayx当y与x适合模型可线性化的一元非线性回归模型第61页/共81页2,(0,)bxyaeN : : 表面上看,该模型比上面的模型简单,然而它却无法化成线性回归,因为它是所谓本质上非线性的模型。可线性化的一元非线性回归模型 值得注意的是,并非所有的曲线回归问题都可线性化,例如 第62页/共81页2yabxcx 其其实实,还还有有一一种种曲曲

27、线线,这这样样的的回回归归称称作作。如如果果自自变变量量只只有有一一个个,称称为为一一元元多多项项式式回回归归;如如果果自自变变量量有有多多个个,称称为为多多元元多多项项多多项项式式回回归归式式回回归归。2012 mmybbx b xb x L L对于一元m次多项式回归, 212,mmxx xxxxL L令令则则上上式式化化为为可线性化的一元非线性回归模型第63页/共81页01122 mmybb xb xb x L L因此可以用前面的方法解决多项式回归问题。二元多项式回归处理方法类似。 值得注意的是,随着自变量个数的增加,多元多项式回归分析的计算量急剧增加。因此,在多项式回归中较为常用的是一元

28、二次多项式回归和一元三次多项式回归。 可线性化的一元非线性回归模型第64页/共81页 解决线性回归问题的常用软件有:Matlab,统计软件SPSS和SAS。SPSS的求解与SAS相同。这里介绍Matlab和SAS的求解方法。第65页/共81页其中y为列向量,表示因变量的取值;X为矩阵,代表自变量的取值;(注意:第一列全是1)alpha为置信水平,缺省时取0.05。b,bint,r,rint,stats = regress(y,X,alpha) b- 参参数数 的的估估计计值值,为为列列向向量量。bint-alpha 参参数数 的的置置信信度度为为(1 1)的的置置信信区区间间,第66页/共81

29、页r-残差向量,取值为Y-X*b。rint-残差的置信度为1-alpha的置信区间。stats-回归方程的统计量,stats(1)为复相关系数, stats(2)为F值, stats(3)为F值对应的概率值,stats(4)为误差方差的估计值。线性回归的matlab实现第67页/共81页 对照前面所讲的参数意义,采用Matlab可方便求解该问题。第一个回归模型计算结果如下,其他类似。第 1条线路回归方程参数:系数, 置信下限, 置信上限110.29651,109.37571,111.21731 0.08284, 0.08109, 0.08459 0.04828, 0.04432, 0.0522

30、4 0.05297, 0.05164, 0.05430 0.11993, 0.11684, 0.12303-0.02544,-0.02737,-0.02351 0.12201, 0.11939, 0.12463 0.12158, 0.11855, 0.12461-0.00123,-0.00335, 0.00090线性回归的matlab实现第68页/共81页统计量值R2=0.9995,F=5861.51944,p=0.00000方案0的原始值,预测值,相对误差百分比:164.7800 164.7120 0.0413140.8700 140.8238 0.0328-144.2500 -144.20

31、51 0.0312119.0900 119.0412 0.0410线性回归的matlab实现第69页/共81页第70页/共81页(2)在弹出的表中输入数据,结果如图4.2。其中1-32行为32组实验数据(方案0未选,后面将作为测试数据)。8台机组的出力为表示。表示。, , ,条线路的潮流值用条线路的潮流值用6 6表示,表示,, , ,6 61 18 81 1y yy yx xx x(由于数据较多,可将数据拷贝到记事本或Excel中,然后由SAS直接读入更方便。)SASv9求解过程第71页/共81页SASv9求解过程第72页/共81页(3)鼠标点击Statistics -Regression-L

32、inear Regression,SASv9求解过程第73页/共81页18168,DependentOKxxExplanatoryyyLLLL在在弹弹出出对对话话框框中中,左左边边文文本本文文框框中中将将 个个自自变变量量选选入入框框中中,将将因因变变量量选选入入框框中中,然然后后点点击击即即可可执执行行回回归归分分析析。SASv9求解过程第74页/共81页SASv9求解过程第75页/共81页第一行分别给出的是,自变量个数p,回归平方和,平均回归平方和值,F值,P5861.520.0001=0.050.1F 最最后后一一列列是是指指,故故不不管管检检验验水水平平或或,都都说说明明回回归归方方程

33、程显显著著。第二行依次是,n-p-1,残差平方和,平均残差平方和。第三行依次是,n-1,总偏差平方和。SASv9求解过程第76页/共81页22,100.aRy 第第一一行行依依次次是是误误差差均均方方根根( (剩剩余余标标准准差差,),), 复复相相关关系系数数R R第第二二行行是是因因变变量量均均值值y y,调调整整的的复复相相关关系系数数第第三三行行是是变变异异系系数数,即即最后是参数的估计,每一行依次是,参数,自由度,参数的估计值,标准误差,t值,P.Tt SASv9求解过程第77页/共81页SAS9 可以同时完成6个回归模型参数及各指标的计算,上面只列出了第一个回归计算结果,其他类似。 从复相关系数,均方误差,显著性检验和对原方案的预测几个方面来看,6个回归方程都拟合的很好,从数学的角度说明方程真实地反映了6条线路与8个机组出力的函数关系。SASv9求解过程第78页/共81页第79页/共81页第80页/共81页感谢您的观看。感谢您的观看。第81页/共81页

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!