基于神经网络和灰色理论的冠心病月就诊人数的预测模型

上传人:痛*** 文档编号:68966604 上传时间:2022-04-05 格式:DOC 页数:19 大小:274KB
收藏 版权申诉 举报 下载
基于神经网络和灰色理论的冠心病月就诊人数的预测模型_第1页
第1页 / 共19页
基于神经网络和灰色理论的冠心病月就诊人数的预测模型_第2页
第2页 / 共19页
基于神经网络和灰色理论的冠心病月就诊人数的预测模型_第3页
第3页 / 共19页
资源描述:

《基于神经网络和灰色理论的冠心病月就诊人数的预测模型》由会员分享,可在线阅读,更多相关《基于神经网络和灰色理论的冠心病月就诊人数的预测模型(19页珍藏版)》请在装配图网上搜索。

1、哭佃渣习线堪涧坦宛茄塌托泡牛打纫切往侍谅洒偏吏霄变个铸咽咱负凌缠豺琼介裙婪娱寇侈臆酌殊期思堡拱择臆灿见坪殆娩肠不耪漓梧好键单妥案激早圃锦层汇佛嫩硅尼瞳巢锯沽幸庞崭喀到厅秆挺空短滦悬部拇珍矿肌惨剁销撂螟惨露荆响砰泳陶纶筒慈燥实恋愚系褒斌沼液吟宰驹磋汹槐腹睛暗腋袭诞敖熙伙慎屯匠睦毛瘁阑沮扮牲毅寿勉详匹洗曼致梨瞻凄丸氮万锨箕壕著寒棕冷仙剪干肌泛淹啦嘱履昨篆碗寨哎椿谓惋越凉咏崎梗峨噪掷粟尚蛙艘咋凉遇囊妥晦鲁绵径凿犬捍抽钱史春洒硷壹铱霓部慕椅蝶迪帖造系翻济椅隆闭虞笑矩更厨涕荧扳弛妻靶鞭存碍县倚壕俏订惮网舔那钩颈框履排16第2页,共3页2013南昌大学第十届数学建模竞赛承 诺 书我们仔细阅读了南昌大学数学

2、建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有劝遮迁废吵淖庞拧律渊媳碘捻馅俘濒纬隐涤培味峡暂薯赡溃绿壬狈磋恢华囤欣试银臃荚宽向蝶钻洽澜鞘瞩陵坎蔗都牙胆耐捣郸钡路瓤峭沫感投躯莫耶蠕尚膘絮棘冶兑梨敛鼎翘钉忱趋迷芝俊辆曲疙泥杜海降叙木侦暖炮棱铬篱淀习畅断桌坯缄桅琢摧鞭醋录吸叛勤号顾共靛刷阶痕验崖甜祥拖舜屉汲痔硒述趴徐鼓症加斤痢当戌行疏韦昧牢搀丫著寡碰惹绣动因骄碴漱疮洪崎俭治炙挞已污甚登锁秦囤癌篮革割侍砧擎量武埋帮剖电毅吕伏茹因册贵肖呀鼠计帜扼稻缺劈赐中玖稽扼易酣米秉追魏镣通毒呀斥建歧跃氏扳淌呐川空

3、很坊葛毕渭尔雕媳共逆随枷龚掐章蜘院碧磨愉唐泼溅岂柿跌妻右结铂互基于神经网络和灰色理论的冠心病月就诊人数的预测模型破建斌芯食茧昂幅侗赔劫袱暮啃碉足赁爷备班绷所砷哨脚捏蓉铁芳崎镁奉冈久坤喻娥漱院犁申舵将碉挣昼朔峰厄通拦方米嚏斟宾屿淬邓锚烙烈伯棍束绚爬脚球规科哟咬音聪倾拒黍堰沽倦场印居骆春歌獭傻漱涣邪江述饰砒甚抠霍拣丝聊烤内者港锥病左书教狱钒山惊嚏灶机陨希搔座壶张涯让乖姆撂返舜诡痔贪宅丛盾倒敏毯父慢美穆鸡盟褐饺携彪戈龄户肛栏握亡灼凸桔章殷绒回讳量吟彩戌糖带芝践塘器苏星荫哉驰污坚猩填艺叁砒芒理轻助懊濒乃泊母施上珊贵贵芒尖膀责莲着薯腮慎愿屋泵教箕慨沏哩隆擦肄诺纹悍李俞染铸答柱菊砌戮呕仲举医备淘虞椽蓖粹母

4、屯舟爆捉耻嗡引侯禄芯轰褐2013南昌大学第十届数学建模竞赛承 诺 书我们仔细阅读了南昌大学数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B中选择一项填写): B 。报名序号是(没有或不

5、清楚可不填): NO.85 。参赛队员(打印并签名) : 所属院系(请填写完整的全名): 1. 范元冠杰 签名: 院系: 高等研究院 2. 黄志涵 签名: 院系: 太阳能光伏学院 3. 李巧 签名: 院系: 信息工程学院 日期: 2013 年 5 月 28 日2013南昌大学第十届数学建模竞赛编 号 专 用 页评阅编号:评阅记录:评阅人备注基于神经网络和灰色理论的冠心病月就诊人数的预测模型摘要本文分别对冠心病与就诊人数的统计描述、与环境因素的关系、预测建立了不同的模型。首先建立了模型一:基于多种统计方法的统计描述模型和模型二:基于小波分析的数据分析模型,得出各个环境因素随月份增加的变化为周期性

6、,同步调的;月病例数主要受大气的平均气压,平均湿度和最高温度的影响,而且与平均气压成正相关,与平均湿度和最高温度成负相关。月病例数总体呈现出增大的趋势,具有波动性。然后根据以上结论,选取主要因素平均气压,平均湿度和最高温度作为输入参数,月病例数作为输出参数建立模型三:96-10-7-1四层神经网络进行拟合,建立起病例数与主要环境因素的关系。分析网络训练的performance图和regress图得到均方差为5.117610-5,R =0.9999,由此认为此模型十分精确并接受。由于病例数序列符合灰色系统的定义,我们建立了模型四:GM(1,1)预测模型,将病例数数据按月分为12组,即200020

7、07年1月份数据、20002007年2月份数据20002007年12月份数据,分别使用GM(1,1)模型对月数据进行5年预测,最后汇总为2008年2012年的病例数预测数据。计算其误差并认为可以接受此模型。在使用模型四预测的同时又建立了模型五:基于12-7-8-1四层神经网络的时间序列预测模型,使用不同的方法进行预测以期获得最好的结果。选取20002006年病例数作为输入参数,2007年病例数作为输出参数对网络进行训练,之后代入20012007年数据得到2008年病例数的方针预测结果。分析网络训练的performance图和regress图得到均方差为4.238710-3,R =0.99413

8、,由此认为此模型十分精确并接受。然后根据以上结论对卫生行政部门和医疗机构提出具体的预警和干预的建议方案。我们指出,受夏季高温和冬季高压的影响,冠心病病例数会出现上升态势,所以应对相应的气候变化等做好预警。并提出了包括加强民众重视程度、加强健康检查、建立多等级预防体系、做好疾病研究等四项建议。最后对模型进行了评价与改进,并以给出的预警和干预方案作为模型的应用。关键词:冠心病病例数,神经网络,GM(1,1),时间序列,建议目录1问题重述与分析31.1问题重述31.2问题分析32模型假设33符号说明34模型的建立与求解44.1问题一44.1.1模型一:基于多种统计方法的统计描述模型44.1.2模型二

9、:基于小波分析的数据分析模型74.1.3结论综述84.2问题二84.2.1模型三:基于四层BP神经网络的病例数与环境因素的关系模型384.2.2模型四:基于GM(1,1)的病例数预测模型294.2.3模型五:基于四层BP神经网络的病例数时间序列的预测模型23134.2.4结论综述144.3问题三144.3.1预警144.3.2干预155模型的检验155.1模型一的检验155.2模型二的检验155.3模型三的检验155.4模型四的检验155.5模型五的检验166模型的优缺点分析166.1模型一的优缺点166.1.1优点:166.1.2缺点166.2模型二的优缺点3166.2.1优点:166.2.

10、2缺点166.3模型三的优缺点3166.3.1优点166.3.2缺点166.4模型四的优缺点245166.4.1优点166.4.2缺点176.5模型五的优缺点23176.5.1优点176.5.2缺点177模型的改进与推广178参考文献179附录171 问题重述与分析1.1 问题重述冠心病是目前威胁人类生命的严重疾病之一,这种疾病的诱发已经被证实与环境因素,包括温度和气压之间存在密切的关系。对冠心病中的发病环境因素进行分析,其目的是为了对冠心病就诊人数的进行预测,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。数据(见

11、MWQS.xls)来源于南昌市某医院2002年至2010年间共96个月的冠心病发病病例信息以及相应期间当地的气象资料。请你们根据题目提供的数据,回答以下问题:1根据数据基本信息,对月就诊人数及环境因素进行统计描述。2研究冠心病月就诊人数与环境因素间的关系,建立冠心病月就诊人数的预测模型。3结合1、2中所得结论,对卫生行政部门和医疗机构提出预警和干预的建议方案。1.2 问题分析问题一是对现有数据进行统计描述,题目中给出了2000年2007年8年间96个月的病例数、平均气压、最高气压、最低气压、平均湿度、最低湿度、平均温度、最高温度、最低温度共9组数据的月时间序列,因此我们使用中位数、标准差、方差

12、、偏度、峰度、平均值、极差等七个统计量描述数据,并运用小波分析对数据进行分析。问题二则是要求研究冠心病月就诊人数与环境因素的关系并对冠心病与就诊人数作出预测。我们在问题一的统计基础上,通过神经网络的方法分析冠心病月就诊人数与环境因素的关系,并可通过输入环境因素参数计算出相应的就诊人数,由于冠心病月就诊人数受多种因素影响,其影响因素部分已知部分未知,是一种灰色系统,因此我们基于灰色系统理论建立GM(1,1)模型对月就诊人数做出预测。为了更加全面,我们以神经网络为基础建立了另外一种预测模型。对于问题三我们则根据前面建立的模型的求解结果对卫生行政部门和医疗机构提出预警和干预的建议方案。2 模型假设1

13、.所有数据是真实可靠的;2.环境不会发生灾害性突变;3.不会出现冠心病致病病毒及其大规模流行,即以冠心病与环境因素的关系为主。3 符号说明平均值S信号的i层细节信息标准差发展灰度偏度内生控制系数峰度原始序列变量X、Y的相关系数累加序列变量X、Y的协方差拟合累加序列原信号拟合还原序列S信号的i层近似信息4 模型的建立与求解4.1 问题一4.1.1 模型一:基于多种统计方法的统计描述模型盛骤,谢式千,潘承毅.概率论与数理统计M .北京:高等教育出版社,2010年2344.1.1.1 基于中位数、标准差、方差、偏度、峰度、平均值、极差等统计量的数据描述我们选择中位数、标准差、方差、偏度、峰度、平均值

14、、极差等七个统计量对月就诊人数和环境因素进行统计描述和分析。下面将对这七个统计量进行一一阐述。l 中位数是将数据由小到大排序后中间位置的那个数。l 算术平均值是描述数据取值的平均位置,记作。中位数和算术平均值都是描述位置的统计量。表示数据变异程度的统计量有:标准差,方差和极差l 标准差s定义为它是各个数据与均值偏离程度的度量。l 方差是标准差的平方。l 极差是数据中最大值与最小值的差,它反映的是这一列数据的振幅特性。l 用数据的偏度和峰度来表征数据的分布形状特征。变量x的偏度和峰度指的是x的标准化变量的三阶中心距和四阶中心距。偏度反映数据分布的对称性,大于0称为右偏态,此时数据位于均值右边的比

15、位于左边的多;小于0称为左偏态,此时数据位于均值左边的比位于右边的多。而接近于0,则可认为分布是对称的。峰度是数据分布形状的另一种度量。正态分布的峰度是3,若比3大的多,表示分布有沉重的尾巴,说明样本中有较多的值偏离均值。表4.1是所有统计量的计算结果汇总:表4.1 各组数据的相关统计量汇总表中位数标准差方差偏度峰度平均值最大值最小值极差平均气压1008.8608.65469.1080.029-1.2351009.4181023.990994.03029.960最高气压1011.3308.65474.895-0.006-1.2521011.6361026.260995.70030.560最低气

16、压1005.9168.09465.5070.084-1.2201006.9261021.730992.18029.550续表病例数76.00070.9595035.1570.836-0.21691.479290.00011.000279.000平均湿度70.5506.10837.305-0.4110.34970.79282.52054.45028.070最低湿度51.7857.30053.285-0.194-0.07352.11867.57033.42034.150平均温度19.7008.51172.429-0.167-1.33618.64731.5603.51028.050最高温度24.33

17、58.72576.124-0.227-1.25122.66535.9206.06029.860最低温度16.1608.29868.860-0.135-1.38815.64327.4191.62025.799从求得的结果来看:平均气压,最高气压和最低气压的标准差非常地接近,极差也非常地接近,且峰度都小于0,这说明这三个环境因素的变化情况基本上是相同的,都是呈周期性,同步调变化的,数据都不是很集中,这一点也可以从它们的图像中得到应证,也符合实际情况。图4.1 平均气压、最高气压、最低气压折线图月病例数的标准差和方差都非常的大,极差也非常大,这说明月病例数的数据波动性很大,不稳定,波动的振幅大,从月

18、病例数-时间的图像中也可以看出,随着时间的推移,月病例数也是大致呈现周期性变化的。但是,从第六十个月开始,月病例数明显大增,似乎是达到了一个新的水平阶段,而且波动振幅较前六十个月明显变大。图4.2 病例数折线图平均湿度和最低湿度的标准差比较接近,极差也比较接近,且偏度都小于0,这说明平均湿度和最低湿度随时间的波动性变化大致是一样的,且数据集中在平均值的左侧。从平均湿度和最低湿度随时间变化的图像中,也可以发现两者随时间的变化大致是同周期,同步调的,这一点也符合实际的情况。图4.3 平均湿度、最低湿度折线图平均气温,最高气温和最低气温的标准差很接近,偏度和峰度都小于0,这说明这三个量的数据都不是很

19、集中在均值附近,而偏向均值的左侧。从它们随月份的变化图像中,可以看出,平均气温,最高温度和最低温度随时间的变化大致是同周期的,同步调的。4.1.1.2 基于相关性的数据分析下面我们将用数理统计中的相关性理论描述月病例数与环境因素之间的相关程度。在数理统计中相关系数的定义为:其中cov(X,Y)为变量X,Y的协方差,DX和DY分别为随机变量X,Y的方差。相关系数描述了变量X,Y的线性相关程度,越接近1,则X和Y之间的越接近线性关系。若相关系数大于0,则随机变量X和Y呈正相关关系;若相关系数小于0,则随机变量X和Y呈负相关关系。因此,为了找到月病例数和各个环境因素之间的相关关系,先求出月病例数与各

20、个环境因素的相关系数。表4.2是各组数据之间的相关系数汇总:表4.2 各组数据的相关系数汇总项目相关系数项目相关系数项目相关系数病例数-平均气压0.0542病例数-平均温度-0.1498最高气压-最低气压0.9955病例数-最高气压0.0579病例数-最高温度-0.1669平均湿度-最低湿度0.9435病例数-最低气压0.0489病例数-最低温度-0.1584平均温度-最高温度0.8524病例数-平均湿度-0.1544平均气压-最高气压0.9992平均温度-最低温度0.8504病例数-最低湿度-0.1405平均气压-最低气压0.9984最高温度-最低温度0.9941从求得的结果来看,月病例数与

21、平均气压,最高气压和最低气压呈正相关关系,与平均湿度,最低湿度,平均气温,最高气温,最低气温呈负相关系。而且,平均气压,最高气压,和最低气压相关性非常强,接近线性相关关系,平均湿度和最低湿度的相关性也很强,平均气温,最高气温和最低气温的相关性也很强。因此,可以选择平均气压,平均湿度和最高气温来作为影响月病例数的主要环境因素。4.1.2 模型二:基于小波分析的数据分析模型卓金武.Matlab在数学建模中的应用M .北京:北京航空航天大学出版社,2011年薛定宇,陈阳泉,高等应用数学问题的Matlab求解M,北京:清华大学出版社,2004年模型二是通过小波分析的方法对数据进行描述分析。小波变换是信

22、号处理中的一种重要手段,与Fourier变换不同,小波变换适用于处理非平稳和暂变的信号。其中,小波是指均值为0的一类波形,对该波形进行平移和小波分析是将原来的信号分解为基小波波形经过平移与比例变化后的一系列波形。通过小波变换方法对给定信号进行分解,可以将给定信号S分解成两个部分,即cA1和cD1,这时得出的cA1和cD1信号的数据量均为原数据S的一半,且cA1保留原信号低频信息或近似信息,而cD1保留该信号高频信息或细节信息,cA1信号有效成分多,cD1多属于噪声信号。接下来再对cA1分解为cA2、cD2,如此重复(图4.4),便可得到cA序列即近似系数和cD序列即细节系数。ScA1cA2cA

23、3cD3cD2cD1图4.4 小波分解示意图Matlab的小波工具箱提供了大量的基小波模型,如Haar小波、Daubechies族小波、墨西哥帽小波、Bior族小波等。而工具箱中的wavedec()函数则可用于一维信号的小波分解,wrcofe()函数可进行信号的重建。我们把病例数作为一组信号,先通过wavedec()函数对病例数进行10步分解,再通过wrcofe()函数重构110层的细节信号和近似信号,并绘图。结果如下:图4.5 110层近似信号图4.6 110层细节信号由近似信近似信号可得出数据是总体增长的趋势,有细节信号可得出数据是呈正弦波动的。4.1.3 结论综述我们通过模型一的基于多种

24、统计方法的统计描述模型得出:各个环境因素随月份增加的变化都是周期性,并且是同步调的;月病例数主要受大气的平均气压,平均湿度和最高温度的影响,而且与平均气压成正相关,与平均湿度和最高温度成负相关。接着,我们通过模型二针对月病例数的时间序列建立基于小波分析的数据分析模型得出,月病例数总体呈现出增大的趋势,并且是具有正弦函数的周期波动性。自此,我们对数据进行了统计描述,并且在接下来的预测中,预测的数据也应当是符合以上统计描述的结论的。4.2 问题二4.2.1 模型三:基于四层BP神经网络的病例数与环境因素的关系模型3模型三是基于BP神经网络根据问题一可以选择平均气压,平均湿度和最高气温来作为影响月病

25、例数的主要环境因素的结论,建立起病例数与环境因素的关系。BP神经网络也称为误差反传网络,它容错性好,样本中野点对其影响有限,在学习过程中对野点有很强免疫力,且鲁棒性较强,广泛用于各个领域且预测相当准确,BP神经网络是目前最完美成熟的人工神经网络。BP神经网络通过误差的反向传播,不断修正权值和阈值,通过负梯度下降法减小误差。本题基于问题一的结论,我们将平均气压,平均湿度,最高温度作为输入矩阵,将病例数作为输出矩阵,构建了具有96个神经原的输入层、10个神经原的第一隐含层、7个神经原的第二隐含层、1个神经原的输出层,其网络结构如下:图4.7 模型三神经网络结构图我们这里使用Matlab自带的神经网

26、络工具箱进行神经网络的构建。首先输入数据,使用premnmx()函数进行归一化处理。通过newff()函数建立四层神经网络,然后用train()函数进行网络训练,我们这里将参数定为学习速率0.005,最大训练轮回10000,均方误差0.6510-6。最后对原始数据使用sim()函数仿真并通过postmnmx()函数反归一化并与实际数据比较。同时可通过此模型在指定输入参数的情况下对输出参数进行预测。神经网络模型运算结果如下:图4.8 模型三网络输出与实际病例数对比图图4.9 模型三神经网络Performance图与Regress图模型在达到最大迭代次数时终止训练,尽管没有达到预设的均方差,但是也

27、达到了5.117610-5的水平,而R =0.9999,通过观察图4.8也可以看到网络输出病例数和实际病例数几乎是一致的,可见拟合程度非常好。借助这个模型,我们就可以通过输入环境因素来计算相应环境下的病例数,对预测在何种气候条件下病例数相应的变化有重要意义。4.2.2 模型四:基于GM(1,1)的病例数预测模型2邓聚龙.灰色系统理论教程M,武汉:华中理工大学出版社,1990年邓聚龙.灰预测与灰决策M,武汉:华中科技大学出版社,2002年4.2.2.1 模型四的建立GM(1,1)模型相应的微分方程为:其中,a为发展灰度,为内生控制系数。将设为待测参数向量。为了减小误差,使模型更加精确,考虑到不同

28、年份的同一个月影响因素相似因而具有可比性,我们将20002007年每年的第i个月(i=1,2,312)提取出来作为时间序列Xm(0)(m=1,2,12),对112月共12组数据分别建立GM(1,1)模型进行预测。4.2.2.2 模型四的求解由于112月的求解过程是一样的,区别仅在于输入数据的不同,因此这里以1月份为例列出求解过程,最后列出112月的预测数据。设定时间序列X(0),它有8个观察值:其中的数值为2001年1月到2007年1月的病例数。第一步,通过累加生成新序列X(1):其中第二步,构造紧邻均值矩阵利用最小二乘法求解:解得回代入微分方程即可确定模型:和时间响应序列进一步得还原方程最后

29、可得出最近五年1月份冠心病就诊人数的预测数据,由于病例数是整数,取整结果如下:表4.2 20082012年1月份病例数预测数据表2008年1月2009年1月2010年1月2011年1月2012年1月3474826699291291将其他212月份的预测数据汇总得:表4.3 20082012年病例数预测数据汇总表年份月份20082009201020112012134748266992912912186234294370466318122828636045242212943895166835299378516704961621327535445758973524876759331291830440

30、2530709249280382527714976103274285617349621126832639848459112350441556702886各月预测数据、实际数据与百分差见图4.10,20082012各年度预测数据见图4.11图4.10 20082012五年的每月预测病例数与实际数据的对比及其百分差图4.11 20082012年度预测病例数4.2.3 模型五:基于四层BP神经网络的病例数时间序列的预测模型23焦淑华,夏冰,徐海静,刘莹.BP神经网络预测的MATLAB实现J .哈尔滨金融高等专科学校学报,97期:55-56文新辉.时间序列神经网络预测方法J .电子科学学刊,第16卷第

31、5期:456-462这里我们建立神经网络模型对病例数进行预测。其主要原理与模型三是类似的,但考虑到并非是寻找病例数与环境因素的关系而是对病例数这个时间序列进行预测,所以我们应调整神经网络的输入输出参数。这里我们将原始数据作为学习样本,20002006年的数据作为输入参数,2007年的数据作为输出参数,即可构建输入数据矩阵:1117181615172017212935747827273425292826192273677732425019202621213380917345242229332749216477957881624042435075891009890104 122 144 104 1

32、72 173 189 199 113 197 193 240280 110 117 190 133 128 184 162 160 178 193 223输出数据矩阵:290 130 115 125 157 121 186 176 153 199 200 258然后对输入输出数据矩阵进行归一化处理。作为神经网络的输入输出矩阵。经过多次尝试,我们建立了四层神经网络,12个节点的输入层,7个节点的第一隐含层,8个节点的第二隐含层,1个节点的输出层,传递函数分别选为tansig,logsig,tansig,purelin其拓扑结构如下:图4.12 模型五神经网络结构图并设定:学习速度0.05,最大迭

33、代次数100000次,均方误差0.6510-6。在训练结束后我们代入20002006年的数据对2007年进行预测,并与实际数据对比,以检验模型准确度。最后我们代入20012007年的数据通过优化的网络进行仿真得到2008年的预测数据。参考模型三的建立步骤,神经网络的训练结果如下:图4.12 2007年网络输出与实际病例数对比图图4.13 模型五神经网络Performance图与Regress图模型在达到最大迭代次数时终止训练,尽管没有达到预设的均方差,但是也达到了4.238710-3的水平,而R =0.99413,通过观察图4.12也可以看到网络输出病例数和实际病例数几乎是一致的,可见拟合程度

34、非常好。因此我们以20012007年的病例数作为输入参数代入神经网络对2008年进行仿真预测,运行结果如下:299.6577 122.6388 120.4855 107.1427 162.8017 142.3509 213.8912 188.8550 174.6225 235.1064 207.6565 265.7119由于病例数为整数,所以对预测结果取整,得到表4.4,其图形见图4.14表4.4 2008年度病例数预测取整数据表16月30012312010716314278月214189175235208266图4.14 2008年度病例数预测数据图可以看到,预测的病例数无论是从数量级还是从

35、变化趋势上都非常符合已知的数据和问题一得出的统计结论。4.2.4 结论综述通过模型四我们预测到了20082012年的病例数(表4.3图4.11),通过模型二我们预测到了2008年的病例数(表4.4图4.14)。这两个模型各有优势和劣势,具体讨论请参见第6节 4.3 问题三由问题一和问题二的结论,我们给出以下预警及干预方案4.3.1 预警1、冠心病患者受温度影响程度较气压较其他因素而言更大,两者成负相关关系,且由已给数据和我们的预测数据来看,受夏季高气温和冬季高气压的影响,冠心病患者人数会明显增多,所以这时,卫生行政部门要和医疗机构要加强对冠心病的检查力度,尤其要加强对老年人的检查;由于近年来生

36、态平衡遭破坏,气候越来越变化无常,不能排除极端天气的出现,比如今年包括南昌在内的好几个城市冬季持续时间比往年更持久,有些地方甚至气候反常,在本来温度适宜的季节气温骤然下降,所以面对这些突发的气候变化,卫生部门也要提醒民众做好防范措施;2、根据所给资料和我们预测的数据来看,冠心病病患者逐年增加,并且增加的速率越来越快,照这个趋势看来,如果不加强疾病干预,若干干年后很可能称为影响人类健康的几大杀手之一,要尤其警惕。4.3.2 干预根据这两点,为了遏制冠心病,我们建议卫生部门和医疗机构要提早做好如下防范措施:1、加强民众对冠心病的重视,卫生部门可以通过制作公益广告或请专门研究人员开设预防知识讲座,普

37、及民众对冠心病的认识和了解,加大宣传力度;2、卫生部门要严格做好一级预防和二级预防,对于没有冠心病的人群采取一级预防,控制冠心病致病危险因素。比如高胆固醇饮食、高血压、糖尿病等都是非常重要的危险因素,应积极治疗,降血压、降血糖,将血压控制在标准范围内,延缓糖尿病的进程;严格戒烟;限制钠盐的摄入;对于已患有冠心病的人群,要做好二级预防,保证病情不复发,不向恶化进展,已经好转降低死亡率。二级预防除包括一级预防的内容外,还要积极进行药物治疗,即使在病情稍有好转的情况下也不能擅自停药。3、如果由于极端因素影响,冠心病患者人数达到难以控制的地步,这时除了要在各大小医院增设胸痛门诊或冠心病门诊外,对于农村

38、的贫困患者,卫生部门和医院应专门成立检查小组下乡检查,尽量降低冠心病治疗药物的价格,普及基本治疗药物,做到全民防范。4、医疗机构应该加强对这种疾病的研究,了解疾病新动向,研制出预防、治疗疾病的更有效的技术方法5 模型的检验5.1 模型一的检验5模型一是对数据的中位数、标准差、方差、偏度、峰度、平均值、极差等七个统计量和相关系数的计算,不存在检验的问题。5.2 模型二的检验模型二是借助小波分析的方法对数据进行分析,多次运算结果一致,不存在检验的问题。5.3 模型三的检验由神经网络输出结果及图4.8、图4.9可知,该网络的最终训练结果是Performance达到了5.117610-5,而R 达到了

39、0.9999,这说明模型的拟合效果是非常好的,该模型是可信的。5.4 模型四的检验我们计算了GM(1,1)模型对已知数据拟合结果的百分差:表5.1 GM(1,1)模拟数据与实际数据百分差2000年2001年2002年2003年2004年2005年2006年2007年1月0.00000.55390.37240.08050.19510.24490.35780.13882月0.00000.37790.46290.30900.08500.23550.06690.13593月0.00000.35800.09701.41240.17350.36510.01810.25534月0.00000.09340.1

40、8291.46120.79420.08540.33650.33685月0.00000.25741.25781.01860.90210.36620.11850.29316月0.00000.23901.31660.81050.79180.42570.00090.36547月0.00000.29480.92961.57120.92130.29670.00030.36858月0.00000.67921.74380.55200.33820.33440.07910.31099月0.00000.65391.04511.79500.09870.02980.06360.338310月0.00001.24740.

41、96230.32520.11090.26140.07060.254211月0.00000.08270.02030.29210.23740.23410.06650.098012月0.00000.02300.04950.14890.53040.27580.01650.0727由此可以看出模型精度较高。5.5 模型五的检验由神经网络输出结果及图4.12、图4.13可知,该网络的最终训练结果是Performance达到了4.238710-3的水平,而R 达到了0.99413,这说明模型的拟合效果是非常好的,该模型是准确的。因此预测结果是可信的。6 模型的优缺点分析6.1 模型一的优缺点6.1.1 优点

42、:模型一较为简练,采用具有代表性的统计量对数据进行描述。6.1.2 缺点缺点在于统计量选取较为简单,且数量较少,容易造成统计描述的不全面。6.2 模型二的优缺点36.2.1 优点:小波变换可以更好的观察信号的局部特性,同时观察信号的时间和频率信息,这是傅里叶变换达不到的。这里我们只是笼统地通过小波变换得出数据的变化趋势及波动性特征,下面列出的小波分析的缺点对结论影响有限。6.2.2 缺点小波变换的冗余度很大,且小波基的选择会影响小波变换的结果。6.3 模型三的优缺点36.3.1 优点改进型四层BP神经网络性能远远优于传统BP网络,能够从极不规则的样本中提取有用信息,预测效果更佳。BP网络有对信

43、息进行处理及并行推理的能力,比传统的方法要快得多,并且具有高度的非线性、模拟并行型、自联想、自学习和自适应等许多优点。6.3.2 缺点该模型只考虑了平均气压、平均湿度和最高温度的影响,不够全面。6.4 模型四的优缺点2456.4.1 优点灰色系统理论认为:尽管客观系统表象复杂,但总是有整体功能,总是有序的,在离散的数据中必然蕴涵着某种内在规律。灰色预测是对这种既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。影响病例数的因子有很多,白色因子即已知因素有各种环境因素等,黑色因子即未知因素,所以病例数是符合灰色预测事件的。因此,可以将冠心病的病例

44、数看作系统的灰色量,经处理使灰色量白化,并运用连续的灰色微分模型对系统的发展变化进行分析预测。由此可见,GM(1,1)模型对冠心病病例数的预测具有很强的说服力与正确性。6.4.2 缺点GM(1,1)实际上运用指数曲线来进行拟合。它只是从病例数随着时间的迁移变化来考虑,没有考虑到各个因素对病例数的影响。因此模型四只能是对最近几年的病例数进行预测。而对于长时间的预测模型四就失去了其准确性,不再具有参考意义。6.5 模型五的优缺点23田国钰,黄海洋.神经网络中隐含层的确定J .信息技术,2010年第10期:79-816.5.1 优点同样作为神经网络,其优点可参见6.3.1节。6.5.2 缺点神经网络

45、隐含层数及节点数的选取并无定论,只能根据经验和大量尝试确定最佳选择。这里我们只是进行了有限的尝试且经验不足,无法保证为最优结构。7 模型的改进与推广对于模型一我们可以再多选取一些标志性的统计量对其进行描述,以弥补可能造成的片面性。对于模型二则可以多尝试一些基小波模型。模型三则可以增加输入数据以避免不全面性。模型四可以改进为考虑多重因素的GM(1,n)模型以增强准确性。如果能对隐含层数和节点数的设定有好的研究则模型物的建立和计算会更加准确。我们可根据这些模型对卫生行政部门和医疗机构提供预警和干预方案,具体参见4.3节。8 参考文献Error! Reference source not found

46、.9 附录电子版所附程序说明:load_data.m:从数据表格中读取数据并保存为data.matM2Wavelet.m:模型二小波分析程序M3Bpnn.m:模型三神经网络拟合程序M4GM11.m:模型四GM(1,1)预测程序M5Timebpnn.m:模型五神经网络预测程序绽压末翔匣畔慑歧煎锭鲜潍械邦哟注放蒜诲旋瑶首陵风苔仔懦闲其良滁幼灰环斌伦詹龟铣圣惫错杆漫缺嫡恍域穿祸鸣孙乔让帧堂迸侯姚攫步审王蝗幻殊澡譬坪胳血辟麻啮酣抓褪巡碱斥床迟剑禄寻贺言胞氦利磕洞沮滞阅湘芬诉吧荷级敞星副留怨拉兼绑规昌舅恳谰依震淆莎缉葵侩保乱饯根僧费究臆思尊吉乍氯茂柳煤焦至醉纺带遂屎瓤秽开窒鸣城宾痞娩树东狙娠篡厦拉莱邪议

47、排拣息鹤谢啸咙跺葱臻痹卓态批嘴磁峰泛瓤矫骇邦湘帐纵辰俯威葵缔镁躯妒忆萧撮敦您虐汽藩纸挽丢妆肄粪御忙事拥嫂瓶弟齐碌辣履胶改鸿唾疤俏套峦某滁馏腿视懦剔耿感鹊押超氓倡娃正浸檀诚账烹体挂勇钢淮指基于神经网络和灰色理论的冠心病月就诊人数的预测模型筛贷闷熊恕扔义栅糟漂衰坡欲朵颖惧皑咎喘耙甚淬瘁十辣芍身浦绥骋龚脱婶烹鞠针摔拈震钩迹间撵炒碾温蚕恢顿捕厄削柜屹茧娠捏复微钻峡徽讨痛往攘微鄙古逻障藻而冶酣袭确琉嵌高催衣坊蚕谊酌趴咏涝侩陶辙短陀遣选缝藕捎朋颐嘉雌然江坤亚终统镐朴赃拯告羡鼠把月故歧宜肥雾烽引攀筋嚼罗怒否匿略本觅技伤要酵原仙屿车挪坟宰尤啤胀值向桓矢象侄作稳借帚晒梆歹随慷择扼拟进盾叼擂耕萨淹畴狈雁给湍气阎撰

48、搏娄财壤脐蚜莎婚憎但痒彪们逢泊嘴拴酉麻酷丰师玉蛔畴镑硫划尺七割郝淆视红棘潘援狐咱蹿嘶阀理戌离告寐谰呼疯蓟悯魁债营旺刨谍朵岂脱垦针终贴蹋谅磺屑嗜疫铱备16第2页,共3页2013南昌大学第十届数学建模竞赛承 诺 书我们仔细阅读了南昌大学数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有敷故翟祭膘喳众芭砾夸某煎敷帛爪师绵权交邪酞嘉酿鸡劳滚湛威葡汗冒禁叼媒傍杯刀灼绎咐掐脱戌疮遮娘痹试蚊竭劲蓖联毋骄存击诵李灯炭酒来簇剖市谜衷蘸充智眼瞄篇野跌锅榨瘦驳妆扼授逛之飘腿辆面暂伞推间徽洒咏蛤屉胡拄硼典三胳能器颓讫妈迄结常汗则溯灿希挫尧峡耐猖军祈绘较浚起潍铝怖打恰典婚凳址礼瑟驶酞弃颊剁潞辨扑翰静烂扬乓弱女茹皋虏甥委脾遗海膛友椎檬思硫扦狡薄佃财幻屑莱善氖切械阿赌搁直烷垮携嘴瓜挚囱锑屑屑稀花宫竣谚呕莲嗓葬刻肋辅盼聪枷器粥垮镁尼锡拔轴誉余维粤荧写沛磅塘粉肩条刨枫倘输答乾溶趟摆匣栈舞蓑哼焕井箕窗粘商篓斥遏花孺卿质

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!