基于BP神经网络模型的延吉市GDP预测

上传人:痛*** 文档编号:44654977 上传时间:2021-12-05 格式:DOC 页数:38 大小:154KB
收藏 版权申诉 举报 下载
基于BP神经网络模型的延吉市GDP预测_第1页
第1页 / 共38页
基于BP神经网络模型的延吉市GDP预测_第2页
第2页 / 共38页
基于BP神经网络模型的延吉市GDP预测_第3页
第3页 / 共38页
资源描述:

《基于BP神经网络模型的延吉市GDP预测》由会员分享,可在线阅读,更多相关《基于BP神经网络模型的延吉市GDP预测(38页珍藏版)》请在装配图网上搜索。

1、基于BP_神经网络模型的延吉市GDP预测 65 The Forecast of Yanji GDP Based on BP_Neural Network Model Wenyuan Sun, Zhe Yin, Jinghu Shen* Mathematics Department, Yanbian University, Yanji Jilin Abstract Economic prediction problem is a complex system prediction problem of typical multi-index small sample. In this paper

2、, by using SAS software with stepwise regression analysis method to do the preprocessing of the raw data, the data are easier to analyze. Using the methods of simulation fit-ting, neural network prediction and so on based on the statistical data of Yanjis GDP from 2001 to 2009 after pretreatment, re

3、levant factors which significantly affect economic development situa-tion of Yanji city are worked out. Among them, X1 is the total cost of the first industry; X4 is the number of tourists in Yanji city; X5 is the capital introduced and X6 is the rate of population growth. Next we put the independen

4、ce as the target of principal component analysis and predict Yanji citys economic form in the future, having a certain reference value to better grasp Yanji citys economic development. Keywords GDP, Stepwise Regression Analysis, Principal Component Analysis, Neural Network Model 基于BP_神经网络模型的延吉市GDP预测

5、 孙文渊,尹 哲,沈京虎* 延边大学数学系,吉林 延吉 收稿日期:2015年6月24日;录用日期:2015年7月6日;发布日期:2015年7月13日 *通讯作者。 基于 BP_神经网络模型的延吉市 GDP预测 66 摘 要 经济预测问题是典型的多指标小样本复杂系统的预测问题。本文利用SAS软件做逐步回归分析法对原始数据进行预处理,使数据便于分析研究,预处理后利用仿真拟合、神经网络预测等方法根据20012009年延吉国民生产总值近九年的统计数据,研究出有关影响延吉市经济发展情况的显著影响因素X1第一产业总值、X4延吉市内游客数、X5引入资金及X6人口增长率。再进行独立性为目标的主成分分析并预测延

6、吉市未来经济形式,对更好地掌握延吉市经济发展有一定参考价值。 关键词 GDP,逐步回归分析,主成分分析,神经网络模型 1. 引言 国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国力的重要指标。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中,为评价和衡量国家经济状况、经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度。可以说,它是影响经济生活乃至社会生活的最重要的经济指标。因此对 GDP 进行预测显得十分重要,BP_神经网络是预测 GDP 的一个很好的方法。 经过几十年的发展,BP_神经网络也有了很多种。1943年,心理学家W. Mccul

7、loch和数理逻辑学家W. Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今,并且直接影响着这一领域研究的进展。因而,他们两人可称为人工神经网络研究的先驱。1945年冯诺依曼领导的设计小组试制成功存储程序式电子计算机,标志着电子计算机时代的开始。BP 神经网络是 1986 年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一1。 基于国内生产总值对经济发展的重要性,本文根据延吉统计局的数据,对影响延吉的经济发展因素做了很好的分析,选择其中最主要的四个因素分别为 X1第一产

8、业总值,X4延吉市内游客数,X5引入资金,X6人口增长率,并根据这些因素建立模型,其中只运用了 2001年2009年的 GDP数据,用 2010年和 2011年数据进行预测检验模型的准确性,从而得出利用神经网络对延吉未来的经济发展情况可以做很好的预测。 2. 原始数据的预处理 我们首先分析了影响吉林省 GDP的几个重要因素,通过搜集资料和相关的经济理论,首先选择第一产业,第二产业,第三产业,因为他们是 GDP的构成部分,它们的发展直接体现着 GDP 的发展;其次市内游客数通过增加消费和交通费来增加经济的增长;引进资金、人口增长率、失业率、人均绿地面积和固定投资,它们和 GDP密切相关,不可分割

9、均会对 GDP造成不可忽视的影响。所以选择这几个因素对 GDP进行分析,这样会导致预测结果的精度更高。分析出了影响吉林省 GDP的主要因素,我们对这几个因素和 GDP之间的关系进行建立模型,然后用建立的方程来预测 2010,2011的 GDP。 影响延吉市经济发展的原始数据(来源于吉林省统计年鉴)如表 1。 在做数据分析处理时,首先我利用了 SPSS软件2做了对数据的简单处理。结果如表 2。 基于 BP_神经网络模型的延吉市 GDP预测 67 Table 1. Yanji city in 2001-2009 index data 表 1. 延吉市 2001年2009年各项指标数据 Y (GDP

10、) X1 第一产业 X2 第二产业 X3 第三产业 X4 市内游客数 X5 引进资金 X6 人口增长率 X7 失业率 X8 人均绿地面积 X9 固定投资 12303.15 1.5 11.3 9.4 20.09 2.66 0.38 4 4 20.89 15079.87 3.4 9.3 11.6 26.96 5.2 3.33 4 4 23.04 17690.29 4.1 13.2 11.5 39.17 2.7 1.94 2 3.94 34.58 21246.8 3.6 23 17.7 133.8 1.65 2.01 3 5.64 56.33 26372.59 3.8 18.8 20.3 214.2

11、8 15.3 3.72 2 5 80.03 29392.04 4.6 16.1 20.7 253.5 21.88 3.7 7 8.41 126.07 34180.23 3.1 19.3 19.4 321.1 34.86 1.71 6 8.57 164.1 40902.36 3.6 14.7 17.8 371.93 56.8 2.66 5 8.66 213.58 48048.08 4.5 20.5 11.1 431.76 77.36 2.52 3 8.85 155.58 Table 2. Statistics description 表 2. 统计量描述 N 极小值 极大值 均值 标准差 方差

12、偏度 峰度 统计量 统计量 统计量 统计量 标准误 统计量 统计量 统计量 标准误 统计量 标准误 Y 9 12,303 48,048 27,246 4033.3 12,100 1E+08 0.514 0.717 ?0.751 1.4 X1 9 1.5 4.6 3.578 0.3072 0.9217 0.849 ?1.453 0.717 3.069 1.4 X2 9 9.3 23 16.244 1.5091 4.5272 20.495 ?0.099 0.717 ?1.029 1.4 X3 9 9.4 20.7 15.5 1.5055 4.5166 20.4 ?0.178 0.717 ?2.13

13、1 1.4 X4 9 20.09 431.76 201.4 51.847 155.54 24193 0.136 0.717 ?1.554 1.4 X5 9 1.65 77.36 24.268 9.039 27.117 735.33 1.176 0.717 0.339 1.4 X6 9 0.38 3.72 2.4411 0.3591 1.0773 1.161 ?0.585 0.717 0.25 1.4 X7 9 2 7 4 0.577 1.732 3 0.557 0.717 ?0.643 1.4 X8 9 4 9 6.34 0.745 2.234 4.992 0.085 0.717 ?2.332

14、 1.4 X9 9 20.89 213.58 97.133 23.414 70.241 4933.9 0.434 0.717 ?1.287 1.4 有效的 N 9 上面表格当中数据可以看出各项指标的极大值、极小值、均值、方差、峰度以及偏度等等。 在实际问题中,影响因变量 Y的因素很多,希望从中挑选出影响显著地自变量来建立模型,也就是对 Y影响显著的变量。选择“最优”子集回归的方法,所以利用 SAS软件用逐步回归分析法对原始数据进行预处理,剔除影响小的变量,表 3为第四步剔除结果3: 利用 SAS软件进行编程,运行结果如表 3,从表中我们可以看出对 Y (GDP)影响因素最大变量为 X1第一产业

15、总值,X4延吉市内游客数,X5引入资金,X6人口增长率,这四项指标对于研究问题结果有很大影响。经过逐步回归法对原始数据进行预处理,处理后的数据如表 4。 但是这四个因素之间还具有一定线性关系,因此得用主成分分析对其变量进行归一化处理,用综合指标来预测未来的延吉经济发展情况。 基于 BP_神经网络模型的延吉市 GDP预测 68 Table 3. Analysis of variance 表 3. 方差分析表 Source Df Sum of Squares Mean Squares F Value Pr > F Model 4 1,169,351,574 292,337,893 606.3

16、6 <0.0001 Error 4 1,928,485 482,121 Corrected total 8 1,171,280,059 Variable Parameter Estimate Standard Error Type II SS F Value Pr > F Intercept 8859.87258 1025.64965 35,976,018 74.62 0.0010 X1 1850.54780 431.24438 8,877,894 18.41 0.0127 X4 47.56768 4.34999 57,650,654 119.58 0.0004 X5 157.44

17、478 24.22661 20,362,326 42.23 0.0029 X6 ?669.97247 349.77198 1,768,887 3.67 0.1279 Table 4. The indicators in 2001-2009 years after data preprocessing 表 4. 数据预处理后 2001年2009年的各项指标 Years Y X1 X4 X5 X6 2001 11182.12 1.2 27.85 5.01 0.56 2002 12283.78 1.24 33.88 5.01 1.01 2003 12303.15 1.5 20.09 2.66 0.3

18、8 2004 15079.87 3.4 26.96 5.2 3.33 2005 17690.29 4.1 39.17 2.7 1.94 2006 21246.8 3.6 133.8 1.65 2.01 2007 26372.59 3.8 214.28 15.3 3.72 2008 29392.04 4.6 253.5 21.88 3.7 2009 34180.23 3.1 321.1 34.86 1.71 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析

19、中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。对数据用 SAS软件进行主成分分析3。 分析结果如表 58。 从表中的相关阵的特征值可以看出,前两个主成分的累计贡献率已达 94.4%,因此只需用前两个主分量就能很好的概括这组数据。由最大的两个特征值对应的特征向量可以写出第一、第二主分量: 1 1 4 5 62 1 4 5 60.486535 0.540823

20、 0.473899 0.4861920.489525 0.395792 0.585389 0.510915Z X X X XZ X X X X? ? ? ? ? ? ?= ? ? += ? ? + 主成分之间是相互独立的,不存在包含不包含的关系,因此标准化后的因变量直接用主成分做自变量。将四个因素 ( )1 2 9, , ,i i i iX x x x = ? 的值代入 iZ 的表达式,计算得到的值为第 i个因素在第 t个主分量的得分,记为 ( )1,2itz t = 。 基于 BP_神经网络模型的延吉市 GDP预测 69 Table 5. Simple statistics 表 5. 简单统

21、计量 X1 X4 X5 X6 Means 2.948888889 118.9588889 10.47444444 2.040000000 Std 1.299234818 116.4114893 11.37401876 1.292710331 Table 6. Correction matrix 表 6. 相关矩阵 X1 X4 X5 X6 X1 X1 1.0000 0.5439 0.3364 0.8426 X4 X4 0.5439 1.0000 0.9095 0.4919 X5 X5 0.3364 0.9095 1.0000 0.3394 X6 X6 0.8426 0.4919 0.3394 1

22、.0000 Table 7. Eigenvolues correlation matrix 表 7. 相关矩阵的特征根 Eigenvalue Difference Proportion Cumulative 1 2.73854290 1.7010791 0.6846 0.6846 2 1.03743499 0.87204677 0.2594 0.9440 3 0.16538823 0.10675435 0.0413 0.9853 4 0.05863388 0.0147 1.0000 Table 8. Feature vector 表 8. 特征向量 Z1 Z2 Z3 Z4 X1 X1 0.49

23、6535 0.489525 ?0.657053 0.286531 X4 X4 0.540823 ?0.395792 ?0.198097 ?0.715274 X5 X5 0.473899 ?0.585389 0.195853 0.627997 X6 X6 0.486192 0.510915 0.700486 ?0.109100 经计算得出: 18.3043 21.8041 13.0553 20.3521 25.4426 75.9088 126.8337 151.5505 192.549013.0821 15.2192 8.5802 10.3488 14.0855 51.1336 90.0060

24、108.9994 145.1043Z ? ?= ? ? ? ? ? ? ? ? ? ? ? 上面的矩阵就是主成分分析后的综合指标,这样两个主成分就能代表影响其因素 X1、X4、X5、X6对 GDP所带来的影响。以下模型就利用其主分量作为因变量进行仿真模拟、预测。 3. 模型的建立 为了更好的反应延吉市经济状况的幅度,采用 BP神经网络模型对延吉市 GDP进行拟合,得到相应的一个趋势仿真图,并对此加以分析描述得出结论。 首先,我们给出 BP神经网络模型的一个图形(如图 1)。 BP算法基本原理利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层的反传下去,

25、就获得了所有其他各层的误差估计,并逐渐减小误差。该网络模型 基于 BP_神经网络模型的延吉市 GDP预测 70 Figure 1. BP neural network model 图 1. BP神经网络模型图 分为输入层、隐含层、输出层,共 3层,其中输入层为量化后的矩阵输入值,隐含层包括影响延吉市 GDP的数据,分别为 X1,X4,X5,X6,输出层是 GDP。通过建立 BP神经网络模型对历史数据进行提练,能够在系统内部不知情的情况下,运用软件 Matlab 编程来拟合图像(如图 2),评价延吉市 GDP,预测并检验延吉市近两年 GDP 4。 由上面的分析,首先将各项物质进行量化。然后进行网

26、络值初始化,给各连接权值分别赋一个区间(0, 1)内的随机数,设定误差函数 e,给定计算精度值 310 ?= 和最大学习次数 M = 5000。随机选取第 k个输入样本及对应期望输出: ( ) ( ) ( ) ( )( )1 2, , , nx k x k x k x k= ? ( ) ( ) ( ) ( )( )1 2, , ,o qd k d k d k d k= ? 再计算隐含层各神经元的输入和输出: ( ) ( )11, 2, ,nh ih i hihi k w x k b h p= ? = ? ( ) ( )( ) 1,2, ,h hho k f hi k h p= = ? ( )

27、( ) 1, 2, ,po ho h ohyi k w ho k b o q= ? = ? ( ) ( )( ) 1, 2, ,o oyo k f yi k o q= = ? 利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数 ( ) 12ok 。 oho o hoyie ew yi w? ?=? ? ? ( ) ( ) ( )pho h ohohho how ho k byi kho kw w? ? ? ? ? ?= =? ? ( ) ( )( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )2112qo ooo o oo oo o o od k yo

28、 ke d k yo k yo kyi yid k yo k f yi k k=? ? ? ? ? ? = = ? ? ?= ? ? ? 计算全局误差: ( ) ( )( )21 112qmo ok oE d k y km = = ? 基于 BP_神经网络模型的延吉市 GDP预测 71 Figure 2. Prediction of structure model 图 2. 预测模型结构图 最后判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。 oho o hoyie ew yi w? ?=? ? ? ( ) ( ) ( )pho h ohohho how

29、ho k byi kho kw w? ? ? ? ? ?= =? ? ( ) ( )( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )2112qo ooo o oo oo o o od k yo ke d k yo k yo kyi yid k yo k f yi k k=? ? ? ? ? ? = = ? ? ?= ? ? ? 通过表 2的数据,运用Matlab软件5进行模拟图形,可得图 3。 从图 3 中可以看出:实际样本与网络输出值之间训练和测试的对比图,显然两者之间非常接近,误差极小,因此能够进行预测。 利用主成分归一化处理后的数据,我们对 2001年到 20

30、09年进行预测,其结果如图 4。 从图 4可以看出,经过量化后的数据图像更加具有说服力,并且 GDP受这几个指标的显著影响。2002年至 2003年一场突如其来的“非典”,使我市的旅游业受到了极大的冲击。因此图形当中模拟值和实际值之间有一定的偏差。但可以从图中看出来模拟数据基本和实际 GDP基本相符,因此该模型能后很好的对延吉市经济发展做出很好的预测。 4. 模型预测 通过此模型对延吉市经济(GDP) 2010年和 2011年的预测结果: 从表 9可知,预测值与真实数据相比较误差较小,模拟数据基本和实际 GDP基本相符,因此该模型对于预测未来近几年延吉市 GDP是有一定的说服力。这样我们就可以

31、通过此模型对延吉市 GDP进行预测,这也让我们更好的掌握延吉市经济状况,以更好地促进其经济发展。 5. 结论 利用逐步回归分析,得出延吉第一产业总值、延吉市内游客数、延吉市引入资金、延吉市人口增长率等四个显著因素对其影响较大,但保证不了因素之间独立性,通过主成分分析,简化为两个主成分,这两个主成分解释了所有变量 94.4%的信息,既保证了原始数据的绝大多数信息,又保证了变量间的独立。这样更能简化网络结构,进而通过 BP网络建立映射关系,得到相应年份的仿真,通过以上的分析,可以清楚反映延吉市过去几年的经济状况变化,实际样本与网络输出值之间训练和测试的对比图,显然两者之间非常接近,误差极小,因此能

32、够进行预测。再对 2001年2009年数据进行模型仿真模拟,由于 基于 BP_神经网络模型的延吉市 GDP预测 72 Figure 3. The simulation graphics 1 图 3. 模拟图形 1 Figure 4. The simulation graphics 2 图 4. 模拟图形 2 Table 9. Forecast map 表 9. 预测图 年份 预测的 GDP 真实 GDP 2010 40991.00 40902.36 2011 47704.00 48048.08 延吉市的旅游业对 GDP增长有很大影响,所以在 2002年2003年存在“非典”情况,GDP呈下降状

33、态,以后每年都呈现明显增长趋势,进而总结出延吉市 GDP的变化情况。然后再对 2010年和 2011年的 GDP进行预测,得出 2010年和 2011年的 GDP值与真实值对比,其误差较小,利用此模型进行预测具一定参考价值。 336 Epochs0 50 100 150 200 250 300Best Training Performance is 0.00064959 at epoch 336Mean Squared Error (mse)TrainBestGoal10110010-110-210-310-42001 2002 2003 2004 2005 2006 2007 2008 20

34、09年份GDP3.532.521.51104 运用工具箱客运量学习和测试对比图模拟GDP实际GDP基于 BP_神经网络模型的延吉市 GDP预测 73 参考文献 (References) 1 周政 (2008) BP神经网络的发展现状综述. 山西电子技术, 2, 90-92. 2 罗应婷 (2007) SPSS统计分析从基础到实践. 电子工业出版社, 北京. 3 邓祖新 (2006) 数据分析方法和 SAS系统. 上海财经大学出版社, 上海. 4 卓金武 (2011) MATLAB在数学建模中的应用. 北京航空航天大学出版社, 北京. 5 章德斌, 徐家鹏, 许建军, 等 (2010) 基于监测数据和 BP神经网络的食品安全预警模型. 农业工程学报, 1, 221- 226. The Forecast of Yanji GDP Based on BP_Neural Network ModelAbstractKeywords基于BP_神经网络模型的延吉市GDP预测摘 要关键词1. 引言2. 原始数据的预处理3. 模型的建立4. 模型预测5. 结论参考文献 (References)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!