基于RBF神经网络的股票走势预测模型

上传人:卷*** 文档编号:126163595 上传时间:2022-07-28 格式:DOC 页数:55 大小:884KB
收藏 版权申诉 举报 下载
基于RBF神经网络的股票走势预测模型_第1页
第1页 / 共55页
基于RBF神经网络的股票走势预测模型_第2页
第2页 / 共55页
基于RBF神经网络的股票走势预测模型_第3页
第3页 / 共55页
资源描述:

《基于RBF神经网络的股票走势预测模型》由会员分享,可在线阅读,更多相关《基于RBF神经网络的股票走势预测模型(55页珍藏版)》请在装配图网上搜索。

1、学 士 学 位 论 文 题 目 基于RBF神经网络的股票走势预测模型学 生 殷继平指引教师 于 延 讲师年 级 级专 业 计算机科学与技术系 别 计算机科学与技术学 院 计算机科学与信息工程哈尔滨师范大学5月摘要:股票市场是极其复杂的非线性动力学系统,诸多复杂因素掺杂于其中,使得股市预测异常困难。而神经网络作为非线性动力学系统,具有很强的容错性、自适应性知非线性映射能力,具有可逼近任意非线性持续函数的学习能力和对杂乱信息的综合能力,应用RBF神经网络这种强有力的非线性工具进行研究并进行预测具有着实在的价值、内在的一致性。核心词:RBF;神经网络;股票走势;预测模型目 录第一章 引言1.1选题根

2、据与意义1.2国内外研究现状及发展趋势.11.2.1股市预测研究现状.21.2.2神经网络应用现状及发展趋势.31.3论文的研究措施及预期成果.51.3.1研究措施及研究路线.51.3.2预期成果.61.4本文工作及章节安排6第二章 理论基本与模型分析2.1股票知识.72.1.1股票投资技术分析.72.1.2股市预测面临的重要难题.82.2遗传算法.82.2.1基本思想.92.2.2基本遗传算法的构成要素及基本实现技术.10 2.3 RBF网络的构造与分类.132.3.1 RBF网络的构造.132.3.2 RBF网络的分类.132.3.3 RBF网络的函数逼近理论.15 2.3.4 RBF网络

3、的训练措施.17 2.3.5 RBF神经网络的长处及问题.192.4模型分析.192.4.1需求分析.192.4.2可行性分析.20 第三章 股票预测系统设计与实现3.1股票走势预测模型建立.213.1.1模型建立有关原理.213.1.2股票走势预测模型建立.223.2股票预测系统功能设计.,.253.2.1系统功能构造图.253.2.2系统各部分功能设计.263.3数据库设计.263.4股票预测系统实现.273.4.1股票走势预测.283.4.2数据管理模块.32第四章 股票预测系统应用仿真4.1预测目的及数据来源.33 4.2股票走势预测模型实验仿真及成果分析. .334.2.1数据预解决

4、,.334.2.2实验实例,. .334.2.3成果分析. .37第五章 结论5.1研究成果. .385.2创新点. .385.3存在的局限性. .385.4此后进一步研究内容. .39参照文献. .40Abstract.41基于RBF神经网络的股票走势预测模型股票市场是极其复杂的非线性动力学系统,诸多复杂因素掺杂于其中,使得股市预测异常困难。而神经网络作为非线性动力学系统,具有很强的容错性、自适应性知非线性映射能力,具有可逼近任意非线性持续函数的学习能力和对杂乱信息的综合能力,对于股票市场这样的非线性经济系统的走势,应用RBF神经网络这种强有力的非线性工具进行研究并进行预测具有着实在的价值、

5、内在的一致性。第一章 前言1.1选题根据与意义21世纪,金融已经成为国民经济的命脉,现代经济的心脏。股票市场作为金融市场的核心构成之一,与国民经济发展密切有关,成为了经济的“晴雨表”和“报警器”。随着国内社会主义市场经济体制的建立与完善,国内股票市场自上世纪九十年代初期形成以来,以其独特的魅力在全国各地蓬勃发展。通过几十年的迅猛发展,经历从无到有、从试探性发展到规范性发展过程,显示出强大的生命力,对推动中国经济持续迅速发展起到了积极作用。可见,股票市场在现代市场经济中具有不可忽视、不能轻视和无法替代的地位与作用。随着股票市场的不断发展,股票投资活动成为了现代经济活动中最常用的风险投资活动之一,

6、与相对安全但收入稳定的其他金融投资活动相比,这是一种为了获得高收益而积极承当高风险的金融投资活动。由此可见,风险和收益是股票投资中两个形影不离的基本要素,高风险与高收益并存是股票市场的明显特性。两者在股票投资中往往是成正比的,即投资收益越高,投资者也许承当的风险越大。对于投资者而言,如何获得投资风险与收益之间的权衡关系,成为了至关重要的问题。投资者在进行股票投资时,只能选择在既定收益率的状况下使投资风险尽量小的投资方略;或是选择在自己乐意承受的风险水平的状况下追求使总收益率尽量大的目的。这就使得投资者必须做出选择:风险与收益,孰更重要。相对而言,股市风险对股票市场自身更具有破坏性,一旦股票市场

7、风险发生,其也许引起的一系列严重危害不可想象,对整个国民经济也会产生不良影响。因此,股市风险的防备与化解不仅对投资者同步对国民经济都更为重要。同步,股票市场是极其复杂的非线性动力学系统,诸多复杂因素掺杂于其中,使得股市预测异常困难。而神经网络作为非线性动力学系统,具有很强的容错性、自适应性知非线性映射能力,具有可逼近任意非线性持续函数的学习能力和对杂乱信息的综合能力,可以较好地解决环境信息不十分明确、知识背景不清晰的应用问题。对于股票市场这样的非线性经济系统的走势,应用神经网络这种强有力的非线性工具进行研究并进行预测具有着实在的价值、内在的一致性。1.2国内外研究现状及发展趋势1.2.1股市预

8、测研究现状股市预测具有重大的理论意义和诱人的应用价值,是经济领域的一种重要分支,它对股票市场合反映的多种资讯进行收集、整顿、综合等工作,从股票市场的历史、现状出发,摸索其内在规律,并运用科学的措施,对股市将来发展前景进行预测。目前,针对股票市场体现出的不同特点,国内外学者对股市预测进行了分析和研究,提出了多种多样的预测分析措施。(l)证券投资分析措施分析和预测股价变化趋势和方向的措施,重要分为基本分析法和技术分析法。基本分析法把重点放在股票自身的内在价值上,从影响股票的外部因素入手分析其与股票市场的互相关系,适合长期预测;技术分析法则是仅根据股票市场过去的记录资料,来研究股票市场将来的变动,以

9、期寻找合适的投资对象和时机,获取短期效益。(2)时间序列分析措施这种措施具有严格的数学基本,重要是通过建立股价与综合指数之间的时间序列有关辨识模型,如移动平均法、指数平滑法等来预测股市将来变化。此种分析措施只合用于短期预测,当预测周期变长,其精确性也将急剧下降。(3)灰色预测措施灰色预测法的理论基本是灰色建模理论,指在已知自变量和因变量之间满足某种数学关系和某种特定条件。而也许历史的数据不全面和不充足或某些变量尚不清晰或不拟定,使得预测处在一种半明半暗的状态。随着事件的发展、数据的逐渐积累,某些不拟定的因素逐渐明确,其预测也逐渐由暗变明。(4)人工智能措施人工智能在各个领域得到了广泛应用。其中

10、,神经网络以其自动从股票市场历史数据中提取有关经济活动的规律以及克服老式定量预测措施的某些局限、人为因素的影响等长处,在股票市场预测领域中得到广泛应用研究。1995年chen等用神经网络预测了史坦普500种指数变化;,Hamid等汇2预测了德黑兰股票指数;shaun一innwu:,等人综合运用了老式预测与智能预测措施,提高了预测性能。与国外市场相比,中国股市有着自身的特点,许多学者都进行了研究。叶中行、顾立庭运用神经网络、模糊推理等多种新技术,提出了一种智能模型一一混合认知系统。张健等闭运用BP网络对沪市中的四种股票进行了多方面的分析。梁夏fs,在改善迅速BP算法基本上,提出一种增长网络自纠错

11、功能的预测措施。王上飞等63从线性时间序列预测的角度出发,使用滑动窗技术于径向基函数神经网络(RBF)对IBM公司的股票进行了预测曲线拟合的效果较好。与此同步,国内外学者对股市投资风险度量措施也进行了相应的研究,在经济等领域提出了多种分析措施。(1)Markowitz的均值一方差模型马柯维茨(Markowitz)于1950年刊登的资产组合选择论文中创立了投资组合理论(MPT),提出了证券组合风险的测试措施,从而奠定了现代证券组合理论的基本7。该论文论述了证券收益和风险水平拟定的重要原理,建立了均值一方差模型的基本框架,用于求解投资决策过程中资金在投资对象中的最优分派比例问题。(2)Sharpe

12、的刀值理论刀值是资本资产定价模型(CAPM)中计量风险的指标,刀值的测定措施应以收益率原则差或协方差为理论基本。CAPM是SharPe等人在均值-方差模型的基本上,从单个投资者转向整体市场,以线性化模型度量个别资产对投资组合原则差的影响限度(刀值)建立的。(3)ARCH模型ARCH模型(Auto一RegressiveConditionalHeteroskedaticityModel,自回归条件异方差模型)是恩格尔于1982年初次提出的,用于刻画随时间而变异的条件方差(即条件异方差),其不同于老式的风险度量措施以收益的方差或原则差来测量,而是描述随时间而变异的方差的工具,可以精确地获取诸多时间数

13、列的特性,并将其应用于汇率、股票市场、利率、个股与许多其她类型的资产研究。(4)风险估值模型(VaR)vaR(value一at一Risk)是Jp.MorgonG30集团在考察衍生产品的基本上提出的一种新的风险测试措施,是指在正常的市场条件和给定的置信度内,用于评估和计量任何一种金融资产或证券投资组合在既定期期内所面临的市场风险大小和也许遭受的潜在最大价值损失。1999年,Jean一PhihpPeBouchaudandMarcPotters提出了计算复杂的非线性组合的VaR;1999年,DavidLi提出了使用四阶距计量计算VaR的新措施。(5)R/S分析措施R/S分析(RescaledRang

14、eAnalysis,重新标度极差分析)措施是赫斯特提出的一种时间序列记录措施。她发现大多数自然现象的记录都能由“有偏随机游动”来刻画,即一种趋势加上噪音,趋势强度的噪音水平可以根据重标极差随时间的变化状况来度量,其突破了老式的线性分析范式,使风险的度量更加符合资我市场的实际状况。1.2.2神经网络应用现状及发展趋势神经网络是在对人脑组织构造和运营机制的结识理解基本之上模拟其构造和智能的一种工程系统。目前,神经网络的发展应用已经波及到信息领域、自动化控制领域、工程领域、医学领域及经济领域,在智能控制、模式辨认、计算机辨认、传感技术与机器人、图像解决等方面获得了突破胜进展。8。(l)信息领域神经网

15、络作为一种新型智能信息解决系统,其应用贯穿信息的获取、传播、接受与加工运用等各个环节。信号解决神经网络广泛应用于自适应信号解决和非线性信号解决。前者如信号的自适应滤波、时间序列预测、噪声消除等;后者如非线性滤波、非线性预测等。模式辨认模式辨认波及模式的预解决变换和将一种模式映射为其她类型的操作。神经网络不仅可以解决静态模式如固定图像、固定能谱等,还可以解决动态模式如视频图像、持续语音等。数据压缩在数据传送与存储时,数据压缩至关重要。神经网络可看待传送(或待存储)的数据提取模式特性,只将该特性传出(或存储),接受后(或使用时)再将其恢复成原始模式。(2)自动化领域神经网络和控制理论与控制技术相结

16、合,发展为自动控制领域的一种前沿学科一一神经网络控制。系统辨识在自动控制问题中,系统辨识的目的是为了建立被控对象的数学模型。基于神经网络的系统辨识是以神经网络作为被辨识对象的模型,运用其非线性特性,可建立非线性系统的静态或动态模型。神经控制器控制器在实时控制系统中起着“大脑”的作用,神经网络具有自学习和自适应等智能特点,因而非常适合于控制器。对于复杂非线性系统,神经控制器所达到的控制效果往往明显好于常规控制器。智能检测所谓智能检测一般涉及干扰量的解决、传感器输入输出特性的非线性补偿、零点和量程的自动校正以及自动诊断等。随着智能化限度的提高,功能集成已逐渐发展为功能创新型,而这些信息解决问题正是

17、神经网络的强项。(3)工程领域汽车工程运用神经网络的非线性映射能力,通过学习优秀驾驶员的换挡经验数据,可自动提取蕴含在其中的最佳换挡规律。神经网络在汽车刹车自动控制系统中也有成功的应用。军事工程神经网络同红外搜索与跟踪系统配合可发现和跟踪飞行器。运用神经网络检测空间卫星的动作状态是稳定、倾斜还是摇晃,对的率可达95%。借助神经网络的语音分类与信号解决上的经验对声纳信号进行分析研究,对水下目的的辨认率可达90%。化学工程20世纪80年代中期以来,神经网络在制药、生物化学、化学工程等领域的研究与应用蓬勃开展,获得了不少成果。将神经网络用于鉴定化学反映的生成物,用于鉴定钾、钙、硝酸、氯等离子的浓度等

18、大量应用实例。水利工程近来年,国内水利工程领域的科技人员已成功地将神经网络措施用于水力发电过程辨识和控制、河川径流预测、河流水质分类、水资源规划、混凝土性能预测等许多实际问题中。(4)医学领域检测数据分析许多医学检测设备的输出数据都是持续波形的形式,这些波的极性和幅值常常可以提供故意义的诊断根据。神经网络在这方面的应用非常普遍,一种成功的应用实例是用神经网络进行多道电棘波的检测。生物活性研究用神经网络对生物学检测数据进行分析,可提取致癌物的分子构造特性,建立分子构造和致癌活性之间的定量关系,并对分子致癌活性进行预测。分子致癌性的神经网络预测具有生物学检测不具有的长处。医学专家系统以非线性并行分

19、布式解决为基本的神经网络为专家系统的研究开辟了新的途径,运用其学习功能、联想记忆功能和分布式并行信息解决功能,来解决专家系统中的知识表达,获取和并行推理等问题获得了良好效果。(5)经济领域信贷分析采用神经网络评价系统不仅评价成果具有较高的可信度,并且可以避免信贷分析人员的主观好恶和人情关系导致的错误。神经网络评价系统将公司贷款申请表中的核心数据编码为输入向量,将实际的信用状况作为输出评价,用数以千计的历史数据对网络进行训练后,可给出精确客观的评价成果。市场预测市场预测问题可归结为对影响市场供求关系的诸多因素的综合分析,以及对价格变化规律的掌握。(6)神经网络在股票市场预测中也有广泛应用。虽然神

20、经网络在许多领域应用中获得了广泛的成功,但其发展还不十提成熟,尚有某些问题需进一步研究9。神经计算的基本理论框架以及生理层面的研究仍需进一步。这方面的工作虽然很困难,但为了神经计算的进一步发展却是非做不可的。除了老式的多层感知机、径向基函数网络、自组织特性映射网络、自适应谐振理论网络、模糊神经网络、循环神经网络之外,某些新的模型和构造很值得关注,例如近来兴起的脉冲神经网络和支持向量机。这些新的模型和构造需要我们对此进行更深一步的研究与探讨。增强神经网络的可理解性是神经网络界需要解决的一种重要问题。这方面的工作在此后若干年中仍然会是神经计算和机器学习界的研究热点。在研究监督学习的同步应当结识到非

21、监督学习具有很大的潜力。相对于监督学习来说,非监督学习的研究起步较晚,其研究空间比前者更大。神经计算技术与其她技术特别是进化计算术的结合以及由此而来的混合措施和混合系统,成为一大研究热点。神经网络用于控制系统时尚有许多问题值得研究:现行的学习算法收敛速度低,存在局部最优问题;分布式并行解决方式的网络内部机理并不清晰,选择网络层数、每层神经元个数,还得凭经验;泛化力局限性,制约了控制系统的鲁棒性;需要发明更适于控制的专用神经网络;网络建立模算法和控制统的收敛性与稳定性需进一步研究。神经网络的应用领域将不断扩大,在将来几年中有望在某些领域获得更大的成功,特别是媒体技术、医疗、金融、电力系统、军事等

22、领域。1.3论文的研究措施及预期成果1.3.1研究措施及研究路线本课题采用Java技术实现股票分析的测度平台及遗传神经网络训练平台,测度过程及训练过程体现出平台交互性,灵活而动态,实现真正意义上的“通用性”与“实用性”,其中运用了资本资产定价模型(CAPM理论和遗传算法技术。资本资产定价模型(CAPM)是现代金融理论的三大基石之一,是第一种不拟定性条件下的资产定价的均衡模型,以市场均衡为出发点,给出了证券的盼望收益率与其系统风险因子之间的线性关系,并用实证的措施来度遗传算法是用于复杂系统优化计算的全局优化随机搜索算法,该算法运用随机化技术来指引对一种被编码的参数空间进行高效搜索的措施,具有良好

23、的鲁棒性。本课题的研究路线如下:(l)明确仿真的对象、范畴及规定达到的目的;(2)过程的机理研究、找寻内在规律;(3)整顿基本数据;(4)建立数学模型;(5)选择计算措施;(6)编制及调试计算机程序;(7)进行数据仿真实验;(8)仿真成果的分析讨论。1.3.2预期成果本课题以基于遗传神经网络的股票走势预测模型为技术基本,开发股票走势预测系统,最后结合国内沪市A股市场实际的历史交易数据对该系统进行分析研究。本课题的目的在于通过遗传神经网络的股票走势预测模型的建立,为证券投资者预测股票的价格走势提供预测工具,能对投资者的投资决策提供辅助支持,进而提高证券投资的技术性和科学性,减少中小投资者的投资风

24、险,提高其个人收益。1.4本文工作及章节安排论文简要简介了股票市场预测背景知识,神经网络以及遗传算法技术,重点简介针对股票走势预测而设计开发的应用系统的设计思路和实现措施,最后应用于股票走势预测分析中。本文的章节安排如下:第一章简介股票预测的选题根据、研究意义,分析了多种股票预测措施以及国内外研究现状及发展趋势,提出解决问题的思路,拟定论文工作安排。第二章简介本课题所波及到的理论基本,涉及股票有关知识、资本资产定价模型理论、神经网络、遗传算法的基本原理、实现技术、操作过程等。第三章运用前一章简介的理论基本知识,分别建立股票走势预测模型,具体论述两个预测模型的设计思想和实现措施,简介系统各功能部

25、分。第四章基于第三章建立的股票走势预测模型,分别选用沪市A股以及上证综合指数进行预测仿真,并对成果进行综合对比分析,验证本文研究措施的可行性与解决问题的有效性。第五章对论文工作进行总结,指出了论文的研究成果、创新点、存在的局限性以及此后的研究发展方向。第二章 理论基本与模型分析2.1股票知识股票作为股份资本所有权证书,是一种虚拟资本,是投资入股并获得收益的凭证,其价格体现了市场对资本将来收益钞票流贴现的定价。股票具有如下五个基本特性。 (l)一定的参与性股票反映的是所有权关系,而非借贷关系,股票使股东拥有了一定的参与公司经营、决策的权利以及相应的责任。(2)无期限性股票不还本,没有到期日,投资

26、者一旦购买了股票,就不能退股索还股金。(3)收益性股东凭其持有的股票,有权从公司领取股息或红利,获取投资的收益。(4)风险性股票价格受到多种诸如宏观经济、公司赚钱状况等因素的影响而具有很强的波动性,是一种高风险的金融产品。(5)流通性股票作为一种资本证券,是一种灵活有效的集资工具和有价证券。股票的流通性是指股票在不同投资者之间的可交易性。2.1.1股票投资技术分析股票投资技术分析是运用图表和技术指标,研究市场波动的历史轨迹,归纳、提炼其运营规律,用以预测其将来发展方向及其具体走势的分析措施。技术分析的理论基本是基于三项合理的市场假设:(l)价量反映市场一切信息;(2)股价呈趋势变动;(3)历史

27、走势会多次重演。股票技术分析的特点重要有如下几点:(1)客观性技术分析法是对既成事实的股票历史走势的分析,并根据其运营的内在规律性进行推论预测将来,因此相较于股票基本分析法更加客观。(2)可操作性技术分析法是一种量化的分析,价格的涨跌、指标的变动等,无一不可用数字来记录、分析和表达。(3)公平性技术分析所需要的一切数据,都是由交易所通过证券营业部或传媒发布的,所有投资者都可以在同一时间内获取,对于任何人都是公平、公开的。目前,不同的技术分析措施根据其分析视角、侧重点和手段上的不同,所合用的范畴也有某种限度的差别,重要有波浪分析法、K线分析法、切线分析法、指标分析法等几大类。K线分析理论是建立在

28、分析K线形状和组合的基本之上,其研究手法是根据若干天K线的组合状况,推测证券市场多空双方力量的对比,进而判断证券市场多空双方谁占优势,是临时的还是决定性的。K线又称为阴阳线或蜡烛线,其构造分为实体、上影线、下影线三部分,分别表达开盘价、收盘价、最高价和最低价。一根K线一记录的是证券在一种交易单位时间内价格变动状况。将每个交易时间的K线准时间顺序排列在一起,就构成该证券价格的历史变动状况,叫做K线图,基本形态又可分为阳线、阴线和十字线三种,如图2.1所示。股市预测一般基于如下三点假设:(l)有效市场假设股票市场会对每一条有也许影响股价的信息都做出反映,而多种价格的变动正是这种反映的成果。(2)供

29、求决定假设一切信息都会对股票市场的供求双方力量对比产生影响,供求决定交易量和交易价格。(3)历史相似原则由历史资料概括出来的规律已经涉及了将来股票市场的一切变动趋势。2.1.2股市预测重要面临如下的难题:(l)股价数据具有高噪声宏观经济因素、微观经济因素、市场因素等诸多内外在因素的冲击影响,会导致股市的强烈振荡波动,使得股价(指数)体现为高噪声且存在许多振荡点。振荡点的存在会大大影响系统性能,导致求解过程振荡甚至无法收敛。股价数据的这种特性规定预测系统具有较强的鲁棒性。(2)股价数据的非线性特性股价系统是一种多变量非线性问题。股价自身及影响股价的各变量之间呈现严重的非线性特性。因此,规定有强大

30、的解决非线性问题的能力。而目前较成熟的技术大多解决线性问题和单变量非线性问题,股价实证分析仍然存在不少问题。(3)股价投资者的盲目任意性股价系统的主体是具有主观能动性的广大投资者。因此,投资者商业行为的复杂性、盲目任意性和对未知事件的影响能力使得预测误差相称之大,并且随着时间的累积更加急剧升高。2.2遗传算法遗传算法是一种全局优化技术,它运用生物进化的一系列概念进行问题的搜索,最后达到优化的目的。1975年,Holland出版了遗传算法历史上的典型著作自然和人工系统中的适应性,系统论述了遗传算法的基本理论和措施,并提出了模式定理。同年,Dejong将Holland的模式理论与她的计算实验相结合

31、,进一步完善了基本遗传算法的三大操作算子,在其博士论文遗传自适应系统的行为分析中提出了新的遗传操作技术。遗传算法发展到目前,广泛应用于各个方面,涉及:智能控制、工程设计、图象解决、优化理论、人工生命等领域。2.2.1基本思想遗传算法是借用生物遗传学的观点,模仿自然界生物遗传和进化过程,通过自然选择、遗传、变异等作用机制,实现各个个体的适应性提高,体现了“物竞天择、适者生存”的进化过程。在对求解问题自身一无所知的状况下,遗传算法从代表问题也许潜在解集的一种种群开始,仅对构成种群的个体即带有染色体特性的实体进行评价,并基于适应度值来选择染色体,使适应性好的染色体有更多的繁殖机会。在遗传算法中,通过

32、随机方式产生若干个规定解问题的数字编码,即染色体,形成初始群体;通过适应度函数给每个个体一定评价,裁减低适应度值的个体,选择高适应度的个体参与遗传操作,通过遗传操作后的个体集合形成下一代新的种群。对这个新种群进行反复性地下一轮进化。遗传算法的运营过程为一种典型的迭代过程,其必须完毕的工作内容和基本环节如下:(1)选择编码方略,把参数集合X和域转换为位串构造空间S;(2)定义适应度函数f(幻;(3)拟定遗传方略,涉及选择群体大小n,选择、交叉、变异措施,以及拟定交叉概率Pc、变异概率几等遗传参数;(4)随机初始化生成群体P;(5)计算群体中个体串解码后的适应度值八刀;(6)按照遗传方略,运用选择

33、、交叉和变异算子作用于群体,形成下一代群体;(7)判断群体性能与否满足某一指标,或者已完毕预定迭代次数,不满足则返回环节(6),或者修改遗传方略再返回环节(6),否则进入环节(8);(8)输出种群中适应度值最优的染色体作为问题的满意解或最优解。2.2.2基本遗传算法的构成要素及基本实现技术基本遗传算法只使用选择算子、交叉算子和变异算子三种基本遗传算子,其遗传进化操作过程简朴,具有一定的应用价值。(1)基本遗传算法的构成要素基本遗传算法由四个基本要素构成,即染色体编码、个体适应度评价、遗传算子及运营参数设定。1.染色体编码在遗传算法的运营过程中,它不对所求解问题的实际决策变量直接进行操作,而是对

34、表达可行解的个体编码施加选择、交叉及变异等遗传运算,通过这种遗传操作来达到优化的目的。在遗传算法中如何描述问题的可行解,即把一种问题的可行解从其解空间转换到遗传算法能解决的搜索空间的转换措施就称为编码。编码是应用遗传算法时要解决的首要问题,也是设计遗传算法时的一种核心环节。编码措施除了决定个体的染色体排列形式之外,它还决定了个体从搜索空间的基因型变换到解空间的体现型时的解码措施,编码措施也影响到遗传算子的运算措施。由此可见,编码措施在很大限度上决定了如何进行群体的遗传进化运算以及遗传进化运算的效率。一种好的编码措施,有也许会使得遗传运算可以简朴地实现和执行。2.个体适应度评价基本遗传算法按与个

35、体适应度成正比的概率来决定目前群体中每个个体遗传到下一代群体中的机会多少。因此,规定所有个体的适应度必须为非负数。这样,根据不同种类的问题,必须预先拟定好由目的函数值到个体适应度之间的转换规则,特别是要预先拟定好当目的函数值为负数时的解决措施。3.遗传算子基本遗传算法使用三种遗传算子,即选择算子、交叉算子及变异算子,它们构成了遗传算法具有强大搜索能力的核心,是模拟自然选择以及遗传过程中发生的繁殖、杂交和突变现象的重要载体。遗传算法使用选择算子来对群体中的个体进行优胜劣汰操作:适应度较高的个体被遗传到下一代群体中的概率较大,适应度较低的个体被遗传到下一代群体中的概率较小。遗传算法中的选择操作就是

36、用来拟定如何从父代群体中按某种措施选用哪些遗传到下一代群体中的一种遗传运算。遗传算法中的所谓交叉运算,是指对两个互相配对的染色体按某种方式互相互换其部分基因,从而形成两个新的个体。交叉运算是进化算法中遗传算法所具有的原始性的独有特性,在遗传算法中起着核心作用。变异操作是指将个体染色体编码串中的某些基因座上的基因值用该基因座的其她等位基因来替代,从而形成一种新的个体。从遗传运算过程中产生新个体的能力方面来说,交叉运算是产生新个体的重要措施,它决定了遗传算法的全局搜索能力;而变异运算只是产生新个体的辅助措施,但它也是必不可少的一种运算环节,由于它决定了遗传算法的局部搜索能力。交叉算子与变异算子的互

37、相配合,共同完毕对搜索空间的全局搜索和局部搜索,从而使得遗传算法可以以良好的搜索性能完毕最优化问题的寻优过程。4.运营参数基本遗传算法有下述4个运营参数需要提前设定:群体大小,即群体中所含个体的数量,一般取为20一100;遗传运算的终结进化代数,一般取为100一1000;交叉概率,一般取为0.4一0.99;变异概率,一般取为0.001一0.1。需要阐明的是,这4个运营参数对遗传算法的求解成果和求解效率均有一定的影响,但目前尚缺少选择它们的理论根据。在遗传算法的实际应用中,往往需要通过多次试算后才干拟定出这些参数的取值大小或取值范畴。(2)基本遗传算法的基本实现技术在遗传算法的运营过程中,它不是

38、对所求解问题的实际决策变量直接进行操作,而是对表达可行解的个体编码施加选择、交叉、变异等遗传运算,通过这种遗传操作来达到优化的目的,这是遗传算法的特点之一。下面从遗传算法的构成要素分别论述其基本实现技术。1.染色体编码编码是应用遗传算法时要解决的首要问题,也是设计遗传算法时的一种核心环节。编码措施在很大程序上决定了如何进行群体的遗传进化运算以及遗传进化运算的效率。作为参照,DeJong曾提出了两条操作性较强的实用编码原则:编码原则一:应使用能易于产生与所求问题有关的且具有低阶、短定义长度模式的编码方案。编码原则二:应使用能使问题得到自然表达或描述的具有最小编码字符集的编码方案。由于遗传算法应用

39、的广泛性,迄今为止人们已经提出了许多不同的编码措施。总的来说,这些编码措施可以分为三大类:二进制编码措施、浮点数编码措施、符号编码措施。2.二进制编码措施二进制编码是遗传算法中最常用的一种编码措施,它将问题空间的参数表达为基于字符集O,1构成的染色体位串,它所构成的个体基因型是一种二进制编码符号集。二进制编码措施具有诸多长处,如编码、解码操作简朴易行,遗传操作便于实现,符合最小字符集编码原则。3.浮点数编码措施对于某些多维、高精度规定的持续函数优化问题,使用二进制编码来表达个体时将会有某些不利之处。一方面是二进制编码存在着持续函数离散化时的映射误差,另一方面是二进制编码不便于反映所求问题的特定

40、知识。为改善二进制编码措施的这些缺陷,人们提出了个体的浮点数编码措施。所谓浮点数编码措施,是指个体的每个基因值用某一范畴内的一种浮点数来表达,个体的编码长度等于决策变量的个体数。由于这种编码措施使用的是决策变量的真实值,因此浮点数编码措施也叫做真值编码措施。浮点数编码适合于许多特定规定,如适合于在遗传算法中表达范畴较大的数,适合于精度规定较高的遗传算法,便于遗传算法与典型优化措施的混合使用。4.符号编码措施符号编码措施是指个体染色体编码串中的基因取自一种无数值含义、只有代码含义的符号集。这个符号集可以是一种字母表,如A,B,c,D,;也可以是一种数字序号表,如1,2,3,4,5,。使用符号编码

41、技术便于在遗传算法中运用所求解问题的专门知识,但对于使用符号编码措施的遗传算法,一般需要认真设计交叉、变异等遗传运算的操作措施,以满足问题的多种约束规定,这样才干提高算法的搜索性能。适应度函数遗传算法将问题空间表达为染色体串空间,为了执行适者生存的原则,必须对个体串的适应性进行评价。因此,适应度函数即构成了个体的生存环境。遗传算法的另一种特点是它仅使用所求问题的目的函数值就可得到下一步的有关搜索信息。而对目的函数值的使用是通过评价个体的适应度来体现的。评价个体适应度的一般过程如下:对个体编码串进行解码解决后,可得到个体的体现型;由个体的体现型可计算出相应个体的目的函数值;根据最优化问题的类型,

42、由目的函数值按一定的转换规则求出个体的适应度。对于最优化问题涉及的两大类一一求目的函数的全局最大值、求目的函数的全局最小值,分别由解空间中某一点的目的函数值f(X)到搜索空间中相应个体的适应度函数值F(x)的转换措施:对于求最大值的问题,作下述转换:式中,Cmi。为一种合适地相对较小的数。对于求最小值的问题,作下述转换:式中,cmax为一种合适地相对较大的数。(3)遗传算子遗传算子的设计是遗传算法实行的核心部分,由三部分构成,即选择操作、交叉操作及变异操作。1.选择算子选择操作建立在对个体的适应度进行评价的基本之上,选择操作的重要目的是为了避免基因缺失、提高全局收敛性和计算效率。最常用的选择算

43、子涉及比例选择、最优保存方略、排序选择等。比例选择措施是一种回放式随机采样的措施,其基本思想是:各个个体被选中的概率与其适应度大小成正比。由于是随机操作的因素,这种选择措施的选择误差比较大,有时甚至连适应度较高的个体也选择不上。设群体大小为M,个体i的适应度为Fi,则个体i被选中的概率Pis为:几一侧艺刃,由该公式可见,适应度越高的个体被选中的概率也越大;反之,适应度越低的个体被选中的概率也越小。最优保存方略的思想是将目前群体中适应度最高的个体不参与交叉运算和变异运算,而是用它来替代掉本代群体中通过交叉、变异等遗传操作后所产生的适应度最低的个体。最优保存方略进化模型的具体操作过程是:先找出目前

44、群体中适应度最高的个体和适应度最低的个体,然后将其与目前群体中最佳个体的适应度进行比较,若后者比前者还要好则将目前最佳个体作为新的迄今为止的最佳个体,最后用这个最佳的个体替代掉目前群体中的最差个体。排序选择措施的重要思想是对群体中的所有个体按其适应度大小进行排序,基于这个排序来分派各个个体被选中的概率。排序选择措施具体操作过程是,先对群体中的所有个体按其适应度大小进行降序排序,然后根据具体问题设计一种概率分派表,将各个概率值按上述排列顺序分派给各个个体,最后以各个个体所分派到的概率值作为其可以被遗传到下一代的概率,并基于这个概率值用比例选择(赌盘选择)的措施来产生下一代群体。2.交叉算子交叉算

45、子的设计和实现与所研究的问题密切有关,一般规定它既不要太多地破坏个体编码串中表达优良性状的编码模式,又要可以有效地产生出某些较好的新个体模式。此外,交叉算子的设计要和个体编码设计统一考虑。最常用的交叉算子是单点交叉算子,但单点交叉操作有一定的合用范畴,故人们发展了其她某些交叉算子,如多点交叉,均匀交叉及算术交叉。单点交叉又称为简朴交叉,它是指在个体编码串中只随机设立一种交叉点,然后在该点互相互换两个配对个体的部分染色体。单点交叉的重要特点是:若邻接基因座之间的关系能提供较好的个体性状和较高的个体适应度的话,则这种单点交叉操作破坏这种个体性状和减少个体适应度的也许性最小。多点交叉是指在个体编码串

46、中随机设立了多种交叉点,然后再进行部分基因互换,其具体操作过程是在互相配对的两个个体编码串中随机设立多种交叉点,然后互换两个个体在所设定的多种交叉点之间的部分染色体。需要阐明的是,一般不太使用多点交叉算子,由于它有也许破坏某些好的模式。事实上,随着交叉点数的增多,个体的构造被破坏的也许性也逐渐增大,这样就难有效地保存较好的模式,从而影响遗传算法的性能。均匀交叉是指两个配对个体的每一种基因座上的基因都以相似的交概率进行互换,从而形成两个新的个体。算术交叉是指由两个个体的线性组合而产生出两个新的个体。为了可以进行线性组合运算,算术交叉的操作对象一般是由浮点数编码所示的个体。假设在两个个体X几、X公

47、之间进行算术交叉,则交叉运算后所产生出的两个新个体是:式中,a为一参数,它可以是一种常数,此时所进行的交叉运算称为均匀算术交叉;它也可以是一种由进化代数所决定的变量,此时所进行的交叉运算称为非均匀算术交叉。3.变异算子变异算子的设计涉及两方面的内容,即如何拟定变异点的位置及如何进行基因值替代。最简朴的变异算子是基本位变异算子,同步为适应多种不同应用问题的求解需要,人们也开发出了其她某些变异算子,如均匀变异、非均匀变异等变异措施。基本位变异操作变化的只是个体编码串中的个别几种基因座上的基因值,并且变异发生的概率也比较小,因此其发挥的作用比较慢,作用效果也不明显。均匀变异操作是指分别用符合某一范畴

48、内均匀分布的随机数,以某一较小的概率来替代个体编码串中各个基因座上的原有基因值。其具体操作过程是,先依次指定个体编码串中的每个基因座为变异点,然后对每一种变异点以变异概率Pm从相应基因的取值范畴内取一随机数来替代原有基因值。非均匀变异的具体操作过程与均匀变异相类似,但是它对原有基因值作一随机扰动,以扰动后的成果作为变异后的新基因值,它搜索的重点是原个体附近的微社区域。在进行由X二x,xZxkx:向X二x,xZ二均匀变异操作时,若变异点xk处的基因值取值范畴为卜磊n,.xkrUmax规定随着进化(t,y)可定义为:式中,(t,y)表达四,y范畴内符合非均匀分布的一种随机数代数t的增长,(t,y)

49、接近于。的概率也逐渐增长。例如,(t,y)=y。(1一;(l一“了)e),式中,r为0,1范畴内符合均匀概率分布的一种随机数,T是最大进化代数,b是一种系统参数,它决定了随机扰动对进化代数t的依赖限度。2.3 RBF网络的构造与分类2.3.1 RBF网络的构造RBF神经元网络即Radial Basis Function Neural Network,它的产生具有很强的生物学背景.在人的大脑皮层区域中,局部调节及交叠的感受野(Receptive Field)是人脑反映的特点。基于感受野这一特性,Moody和Darken提出了一种神经网络构造,即RBF网络.图1是这种思想的构造图。这是一种前向网络

50、的拓扑构造,隐含层的单元是感受野单元,每个感受野单元输出为i=Ri(X) =Ri(X-ci/i), i= 1,HX是N维输入向量,ci是与X同维数的向量,Ri()具有局部感受的特点.例如Ri()取高斯函数,即Ri(X)=exp(-X-ci2/2i),Ri()只有在ci周边的一部分区域内有较强的反映,这正体现了大脑皮质层的反映特点.RBF神经元网络不仅具有上述的生物学背景,并且尚有数学理论的支持.运用正则化措施证明了如下结论.若S=(Xi,Yi)RnR i=1,N是训练集合,(,w)表达未知的函数,其中w也未知。正则化问题的学习过程是寻找及参数w使H =(Yi-(Xi,w)2+P2最小。用变分原理可以证明应当选择径向基函数(Ra-dial Basis Function) 。2.3.2.RBF网络的分类RBF网络分类可以从网络参数的不同拟定措施入手.RBF网络的参数拟定过程如下一般RBF网络可以表达到fn(X) =wi(X-cit-1X-ci)-1是控制RBF网络感受野大小的矩阵,由此可知,对于给定激活函数(2)的RBF网络来说有3类参数需要拟定:(1)RBF网络权值wi,i=1,n; (2)网络基函数中心矢量ci,i=1,n; (3)控制矩阵.如果用参数来替代上述3种参数,针对训练样本DN=X

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!