智能控制技术(第6章-神经网络控制)分析解析

上传人:仙*** 文档编号:207580492 上传时间:2023-05-06 格式:PPT 页数:41 大小:1.26MB
收藏 版权申诉 举报 下载
智能控制技术(第6章-神经网络控制)分析解析_第1页
第1页 / 共41页
智能控制技术(第6章-神经网络控制)分析解析_第2页
第2页 / 共41页
智能控制技术(第6章-神经网络控制)分析解析_第3页
第3页 / 共41页
资源描述:

《智能控制技术(第6章-神经网络控制)分析解析》由会员分享,可在线阅读,更多相关《智能控制技术(第6章-神经网络控制)分析解析(41页珍藏版)》请在装配图网上搜索。

1、神经网络控制神经网络控制2神经网络辨识基础神经网络辨识基础 所谓系统辨识,就是所谓系统辨识,就是根据系统的输入和输出根据系统的输入和输出数据数据,在指定的一类系统中选择一个系统,这,在指定的一类系统中选择一个系统,这个系统和所研究的实际系统个系统和所研究的实际系统等价等价。6.2 神经网络辨识由于实际上不可能找到一个与实际系统完全等价的模型。因此,从实用角度看,辨识就是从一组模型中选择一个模型,按照某种准则,使之能最好的拟合所关心的实际系统动态或静态特性。36.3 神经网络辨识神经网络对非线性函数具有任意逼近和自学习能力,为系神经网络对非线性函数具有任意逼近和自学习能力,为系统的辨识,尤其是非

2、线性动态系统的辨识提供了一条十分统的辨识,尤其是非线性动态系统的辨识提供了一条十分有效的途径。有效的途径。神经网络系统辨识实质上是从神经网络模型中选择一个神经网络系统辨识实质上是从神经网络模型中选择一个适当的模型来适当的模型来逼近逼近实际系统的数学模型。实际系统的数学模型。神经网络系统通过直接学习输入输出数据,使所要求的神经网络系统通过直接学习输入输出数据,使所要求的误差函数达到最小,来归纳出隐含在系统的输入输出数误差函数达到最小,来归纳出隐含在系统的输入输出数据中的关系。据中的关系。46.3 神经网络辨识逼近理论是一种经典的数学方法。多项式函数和其它逼逼近理论是一种经典的数学方法。多项式函数

3、和其它逼近方法都可以逼近任意的非线性函数。但由于其近方法都可以逼近任意的非线性函数。但由于其学习能学习能力和并行处理能力力和并行处理能力不及神经网络,从而使得神经网络的不及神经网络,从而使得神经网络的逼近理论研究得到迅速发展。逼近理论研究得到迅速发展。56.3 神经网络辨识u神经网络系统辨识的原理神经网络系统辨识的原理 在神经网络系统辨识中,神经网络用作辨识模型,将对象的输入输出状在神经网络系统辨识中,神经网络用作辨识模型,将对象的输入输出状态态u、y看作神经网络的看作神经网络的训练样本数据训练样本数据,以,以J=e2/2作为作为网络训练的目标网络训练的目标,则通过用一定的训练算法来训练网络,

4、使则通过用一定的训练算法来训练网络,使J足够小,就可以达到辨识对象足够小,就可以达到辨识对象模型的目的。模型的目的。系统辨识的原理系统辨识的原理:给对象系统辨识的原理:给对象和辨识模型施加相同的输和辨识模型施加相同的输入,得到对象的输出入,得到对象的输出y和模和模型的输出型的输出 ,通过调整辨,通过调整辨识模型的结构来使对象的识模型的结构来使对象的输出输出y和模型的输出和模型的输出 之之间的误差最小。间的误差最小。66.3 神经网络辨识u与传统基于算法的系统辨识方法一样,神经网络辨识与传统基于算法的系统辨识方法一样,神经网络辨识同样也需首先考虑以下三大因素。同样也需首先考虑以下三大因素。1.模

5、型的选择模型的选择 模型只是在某种意义下实际系统的一种近似描述,它的确定模型只是在某种意义下实际系统的一种近似描述,它的确定要兼顾其精确性和复杂性。因为如要求模型越精确,模型就会要兼顾其精确性和复杂性。因为如要求模型越精确,模型就会变的越复杂,相反如果适当降低模型精度要求,只考虑主要因变的越复杂,相反如果适当降低模型精度要求,只考虑主要因素而忽略次要因素,模型就可以简单些。所以在建立实际系统素而忽略次要因素,模型就可以简单些。所以在建立实际系统模型时,存在着模型时,存在着精确性和复杂性精确性和复杂性这一对矛盾。在神经网络辨识这一对矛盾。在神经网络辨识这一问题上主要表现为这一问题上主要表现为网络

6、隐含层数的选择和隐含层内节点数网络隐含层数的选择和隐含层内节点数的选择的选择。由于神经网络隐含节点的最佳选择目前还缺乏理论上。由于神经网络隐含节点的最佳选择目前还缺乏理论上的指导,因此实现这一折中方案的唯一途径是通过多次仿真实的指导,因此实现这一折中方案的唯一途径是通过多次仿真实验来达到。验来达到。76.3 神经网络辨识2.输入信号的选择输入信号的选择 为了能够精确有效的对未知系统进行辨识,输入信为了能够精确有效的对未知系统进行辨识,输入信号必须满足一定的条件。从时域上来看,要求系统的号必须满足一定的条件。从时域上来看,要求系统的动态过程在辨识时间内必须被输入信号持续激励,即动态过程在辨识时间

7、内必须被输入信号持续激励,即输入信号必须充分激励系统的所有模态输入信号必须充分激励系统的所有模态;从频域来;从频域来看,看,要求输入信号的频谱必须足以覆盖系统的频谱要求输入信号的频谱必须足以覆盖系统的频谱。通常在神经网络辨识中可选用白噪声或伪随机信号作通常在神经网络辨识中可选用白噪声或伪随机信号作为系统的输入信号。对于实际运行系统而言,选择测为系统的输入信号。对于实际运行系统而言,选择测试信号需考虑对系统安全运行的影响。试信号需考虑对系统安全运行的影响。86.3 神经网络辨识3.误差准则的选择误差准则的选择 误差准则是用来衡量模型接近实际系统的误差准则是用来衡量模型接近实际系统的标准标准。它。

8、它通常表示为一个误差的泛函,记作通常表示为一个误差的泛函,记作其中 是误差适量e(k)的函数,用得最多的是平方函数,即这里的误差e(k)是广义误差,即既可以表示输出误差又可以表示输入误差甚至是两种误差函数的合成。96.2 神经网络辨识与传统辨识方法不同,神经网络辨识具有以下五个特点与传统辨识方法不同,神经网络辨识具有以下五个特点1.不要求建立实际系统的辨识格式不要求建立实际系统的辨识格式。因为神经网络本质上已作。因为神经网络本质上已作为一种辨识模型,其可调参数反映在网络内部的权值上。为一种辨识模型,其可调参数反映在网络内部的权值上。2.可以对本质非线性系统进行辨识,而且辨识是通过在网络外部可以

9、对本质非线性系统进行辨识,而且辨识是通过在网络外部拟合系统的输入输出,网络内部隐含着系统的特性。因此这种拟合系统的输入输出,网络内部隐含着系统的特性。因此这种辨识是由神经网络本身实现的,是非算法式的辨识是由神经网络本身实现的,是非算法式的。3.辨识的辨识的收敛速度不依赖于待辨识系统的维数,只与神经网络本收敛速度不依赖于待辨识系统的维数,只与神经网络本身及其所采用的学习算法有关身及其所采用的学习算法有关,传统的辨识方法随模型参数维,传统的辨识方法随模型参数维数的增大而变得很复杂。数的增大而变得很复杂。4.由于神经网络具有大量的连接,这些连接之间的权值在辨识中由于神经网络具有大量的连接,这些连接之

10、间的权值在辨识中对应于模型参数,对应于模型参数,通过调节这些权值使网络输出逼近系统输出通过调节这些权值使网络输出逼近系统输出。5.神经网络神经网络作为实际系统的辨识模型,实际上也是系统的一个物作为实际系统的辨识模型,实际上也是系统的一个物理实现,理实现,可以用于在线控制可以用于在线控制。6.3 神经网络自适应控制 构造一个参考模型,使其输出为期望输出,控制的目的是使y跟踪r。神经网络自适应控制构造一个参考模型,使其输出为期望输出,控制的目的,是使y跟踪r。对象特性非线性、不确定、不确知时采用。神经网络自适应控制6.4 神经网络神经网络PID控制控制尽管神经网络控制技术有许多潜在的优势,但单纯使

11、用神经网络的控制方法的研究仍有待进一步发展。通常将人工神经网络技术与传统的控制理论或智能技术综合使用。神经网络在控制中的作用有以下几种:1在传统的控制系统中用以动态系统建模,充当对象模型;2在反馈控制系统中直接充当控制器的作用;3在传统控制系统中起优化计算作用;4与其他智能控制方法如模糊逻辑、遗传算法、专家控制等相融合。3.4.1 基于BP神经网络控制参数自学习PID控制 BP神经网络具有逼近任意非线性函数的能力,而且结构和学习算法简单明确。通过神经网络自身的学习,可以找到某一最优控制律下的P,I,D参数。基于BP神经网络的PD控制系统结构如图所示,控制器由两个部分组成:经典的PID控制器:直

12、接对被控对象进行闭环控制,并且KP,KI,KD三个参数为在线整定;神经网络NN:根据系统的运行状态,调节PID控制器的参数,以期达到某种性能指标的最优化。即使输出层神经元的输出状态对应于PID控制器的三个可调参数KP,KI,KD,通过神经网络的自学习、调整权系数,从而使其稳定状态对应于某种最优控制律下的PID控制器参数。基于BP神经网络的PID控制算法可归纳如下:1).事先选定BP神经网络NN的结构,即选定输入层节点数M和隐含层节点数Q,并给出权系数的初值w(2)ij(0),w(3)li(0),选定学习速率和平滑因子,k=1;2).采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-

13、y(k);3).对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入;4).前向计算NN的各层神经元的输入和输出,NN输出层的输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k);5).计算PID控制器的控制输出u(k),参与控制和计算;6).计算修正输出层的权系数w(3)li(k);7).计算修正隐含层的权系数w(2)ij(k);8).置k=k+1,返回到“2)”。3.4.2 改进型BP神经网络控制参数自学习PID控制将神经网络用于控制器的设计或直接学习计算控制器的输出(控制量),一般都要用到系统的预测输出值或其变化量来计算权系数的修正量。但实际上,系统

14、的预测输出值是不易直接测得的,通常的做法是建立被控对象的预测数学模型,用该模型所计算的预测输出来取代预测处的实测值,以提高控制效果。1采用线性预测模型的BP神经网络PID控制器 采用线性预测模型的采用线性预测模型的BP神经网络神经网络PID控制系统算法归纳如下控制系统算法归纳如下:1).事先选定BP神经网络NN的结构,即选定输入层节点数M和隐含层节点数Q,并给出权系数的初值w(2)ij(0),w(3)li(0),选定学习速率和平滑因子,k=1;2).用线性系统辨识法估计出参数矢量(k),从而形成一步预报模型式;3).采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-y(k);4).

15、对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入;5).前向计算NN的各层神经元的输入和输出,NN输出层的输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k);6).计算PID控制器的控制输出u(k),参与控制和计算;7).计算 和 ;8).计算修正输出层的权系数w(3)li(k);9).计算修正隐含层的权系数w(2)ij(k);10).置k=k+1,返回到“2)”。2采用非线性预测模型的BP神经网络PID控制器基于BP神经网络的PID控制算法可归纳如下:1).事先选定BP神经网络NN的结构,即选定输入层节点数M和隐含层节点数Q,并给出权系数的初值w(

16、2)ij(0),w(3)li(0),选定学习速率和平滑因子,k=1;2).采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-y(k);3).对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入;4).前向计算NN的各层神经元的输入和输出,NN输出层的输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k);5).计算PID控制器的控制输出u(k),参与控制和计算;6).前向计算NNM的各层神经元的输入和输出,NNM的输出为 ,计算修正隐含层和输出层的权系数;7).计算 ;8).计算修正输出层的权系数w(3)li(k);9).计算修正隐含层的权系数w

17、(2)ij(k);10).置k=k+1,返回到“2)”。单神经元自适应控制系统结构学习算法系统对象:仿真示例系统输入:MATLAB程序%Single Neural Adaptive Controllerclear all;close all;x=0,0,0;xiteP=0.40;xiteI=0.35;xiteD=0.40;%Initilizing kp,ki and kdwkp_1=0.10;wki_1=0.10;wkd_1=0.10;%wkp_1=rand;%wki_1=rand;%wkd_1=rand;error_1=0;error_2=0;y_1=0;y_2=0;y_3=0;u_1=0;

18、u_2=0;u_3=0;ts=0.001;for k=1:1:1000 time(k)=k*ts;rin(k)=0.5*sign(sin(2*2*pi*k*ts);yout(k)=0.368*y_1+0.26*y_2+0.1*u_1+0.632*u_2;error(k)=rin(k)-yout(k);%Adjusting Weight Value by hebb learning algorithmM=4;if M=1%No Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*u_1*x(1);%P wki(k)=wki_1+xiteI*u

19、_1*x(2);%I wkd(k)=wkd_1+xiteD*u_1*x(3);%D K=0.06;elseif M=2%Supervised Delta learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1;%P wki(k)=wki_1+xiteI*error(k)*u_1;%I wkd(k)=wkd_1+xiteD*error(k)*u_1;%DK=0.12;elseif M=3%Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*x(1);%P wki(k)=w

20、ki_1+xiteI*error(k)*u_1*x(2);%I wkd(k)=wkd_1+xiteD*error(k)*u_1*x(3);%D K=0.12;elseif M=4%Improved Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*(2*error(k)-error_1);wki(k)=wki_1+xiteI*error(k)*u_1*(2*error(k)-error_1);wkd(k)=wkd_1+xiteD*error(k)*u_1*(2*error(k)-error_1);K=0.12;endx(1)=erro

21、r(k)-error_1;%P x(2)=error(k);%I x(3)=error(k)-2*error_1+error_2;%D wadd(k)=abs(wkp(k)+abs(wki(k)+abs(wkd(k);w11(k)=wkp(k)/wadd(k);w22(k)=wki(k)/wadd(k);w33(k)=wkd(k)/wadd(k);w=w11(k),w22(k),w33(k);u(k)=u_1+K*w*x;%Control lawif u(k)10 u(k)=10;endif u(k)-10 u(k)=-10;enderror_2=error_1;error_1=error(k

22、);u_3=u_2;u_2=u_1;u_1=u(k);y_3=y_2;y_2=y_1;y_1=yout(k);wkp_1=wkp(k);wkd_1=wkd(k);wki_1=wki(k);endfigure(1);plot(time,rin,b,time,yout,r);xlabel(time(s);ylabel(rin,yout);figure(2);plot(time,error,r);xlabel(time(s);ylabel(error);figure(3);plot(time,u,r);xlabel(time(s);ylabel(u);假设系统第k+1 个采样时刻的期望输出值为d k

23、+1,则变学习因子自适应神经网络控制系统考虑到实际系统的制约,对控制量u 加了限幅处理,N 1 为一BP 网络,g 为比例环节。如果f 对u 为非线性的,则g 亦为BP 网络。学习算法学习算法为了对网络权值进行在线学习,取输出偏差并定义学习误差式中 为网络输出的对象输出预测值,yk+1 为对象实际输出值。则于是由梯度法得到权值调整规则为如果P 含有纯滞后为T d=L T 的滞后环节时,相应的权值调整规则为在实际应用中,可以先估计一个滞后时间。运行时,如果在第L+1 个采样时刻检测到第一个非零的零状态响应,则可认为纯滞后时间为L T学习因子的选择学习因子的选择 学习因子的选择对系统性能有较大影响,如果学习速率过小,学习过程收敛缓慢,必将影响到控制的实时性;如果学习速率过大,则又会影响到学习的收敛性。采用变学习因子的方法,在学习过程中自动调整学习因子,取得了较好的效果。事实上,假设W0 为理想的权值这时有E k+1(W0)=0,将E 在W处作Taylo r 展开:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!