最优控制(动态求解)参考

上传人:每**** 文档编号:142079507 上传时间:2022-08-24 格式:PPT 页数:174 大小:2.49MB
收藏 版权申诉 举报 下载
最优控制(动态求解)参考_第1页
第1页 / 共174页
最优控制(动态求解)参考_第2页
第2页 / 共174页
最优控制(动态求解)参考_第3页
第3页 / 共174页
资源描述:

《最优控制(动态求解)参考》由会员分享,可在线阅读,更多相关《最优控制(动态求解)参考(174页珍藏版)》请在装配图网上搜索。

1、2021/3/10讲解:XX1第第4章章 最优控制原理与应用最优控制原理与应用 讲解:XX22021/3/10最优控制的基本概念最优控制的基本概念n最优控制研究的主要问题:根据已建立的被控对象的数学模型,选择一个容许的控制率,使得被控对象按照预定的要求运行,并使给定的某一性能指标达到极小值(或极大值)。n从数学观点来看,最优控制研究的问题是:求解一类带有约束条件的泛函极值问题。讲解:XX32021/3/10最优控制问题最优控制问题n最优控制问题的一般提法:在满足系统方程的约束条件下,在容许控制域中确定一个最优控制律,使得系统状态从已知初态转移到要求的目标集,并使性能指标达到极值。讲解:XX42

2、021/3/10最优控制的应用类型最优控制的应用类型I.积分型性能指标n最小时间控制;n最少能量控制;n最少燃料控制;II.末值型性能指标III.复合型性能指标0(),(),fttJF x tx tt dt0fttJdt01()fmtjtjJut dt0()()ftTtJut u t dt(),ffJx tt0(),(),(),ftfftJx ttF x tx tt dt讲解:XX52021/3/104.1 用变分法解最优控制用变分法解最优控制4.1.1 泛函与变分4.1.2 欧拉方程4.1.3 横截条件4.1.4 变分法解最优控制问题讲解:XX62021/3/10 在动态系统最优控制问题中,

3、性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。讲解:XX72021/3/104.1.1 泛函与变分泛函与变分 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为)(tXJ)(tXJ)(tX)(tXJJ 粗略来说,泛函是以函数为自变量的函数。(函数的函数)1、泛函:先来给出下面的一些定义。讲解:XX82021/3/100(),nnnxxnx x R 2、泛函的连续性:则lim()()nnJ xJ x则线性泛函 是连续的,称Jx

4、为线性连续泛函。()J xnR若对于收敛于点x0点列xn,其中x0,xn ,均有则称泛函J在x0处连续。对于线性泛函Jx,若0lim()()nnJ xJ x讲解:XX92021/3/10 满足下面条件的泛函称为线性泛函 这里 是实数,和 是函数空间中的函数。XJXJ)()()(YJXJYXJXY3、线性泛函:讲解:XX102021/3/104、自变量函数的变分:自变量函数 的变分 是指同属于函数类 中两个函数 、之差)(tXX)(tX)(1tX)(2tX)()(21tXtXX 这里,t 看作为参数。当 为一维函数时,可用图4-1来表示。)(tXX讲解:XX112021/3/10图4-1 自变量

5、函数的变分讲解:XX122021/3/10 这里,是 的线性泛函,是关于 的 高阶无穷小,则称为泛函Jx的变分。可知泛函变分就是泛函增量的线性主部。X 当自变量函数 有变分 时,泛函的增量为)(tXX,L XXr XX XJXXJJ 5、泛函的变分:,L X X,r X XX,JL XX讲解:XX132021/3/10当一个泛函具有变分时,也称该泛函可微。和函数的微分一样,泛函的变分可以利用求导的方法来确定。定理定理 设Jx是线性赋范空间Rn上的连续泛函,若在x=x0处Jx可微,则Jx的变分为000,01J xxJ xx讲解:XX142021/3/10证明:由于 是 的线性连续泛函,又因为 是

6、 的高阶无穷小,讲解:XX152021/3/10000000000lim1 =lim,=,J xxJ xJ xxL xxr xxJ xx泛函变分的规则1212122112(1)()(2)()(3),(4)bbaaLLLLL LLLLLL x x t dtL x x t dtdxdxdtdt讲解:XX162021/3/10举例:可见,计算泛函的变分如同计算函数的微分一样。讲解:XX172021/3/106、泛函的极值:若存在 ,对满足的 一切X,具有同一符号,则 称 在 处有极值(极大值或极小值)。0*XX)()(*XJXJ)(XJ*XX 讲解:XX182021/3/10定理定理(变分预备定理变

7、分预备定理):设 是时间区间t0,t1上连续的n维向量函数,是任意的连续n维向量函数,且有 ,若10()()0tTttt dt则必有()t()t01()()0tt01()0,ttt t 讲解:XX192021/3/104.1.2 欧拉方程欧拉方程 假定t0与tf 给定,且初态与末态两端固定。(1)无约束泛函极值的必要条件定理定理 设有如下泛函极值问题:*()x t0()min(),(),fttx tJF x tx tt dt(1)已知x(t0)=x0 x(tf)=xf,则极值曲线 应满足如下欧拉方程讲解:XX202021/3/100)(xFdtdxF(2)00()()()()0ft tft t

8、FFx tx txx(3)及横截条件讲解:XX212021/3/10)()()(*txtxtx)()()(*txtxtx于是泛函J 的增量 可计算如下(以下将*号省去)JdttxxFtxxxxFJftt,0022(),()fttFFxxoxxdtxx上式中 是高阶项。22(),()oxx证明:与 之间有如下关系)(tx)(tx 讲解:XX222021/3/10 根据定义,泛函的变分 是 的线性主部,即JJfttdtxxFxxFJ0fffttttttvduuvudv000对上式第二项作分部积分,按公式可得ffttttxxFxdtxFdtdxFJ00)((4)讲解:XX232021/3/10 J取

9、极值的必要条件是 等于零。因 是任意的,要使(3-2)中第一项(积分项)为零,必有Jx0)(xFdtdxF(5)(4)式中第二项即为结论中的式(3).讲解:XX242021/3/10n举例:利用上面的结论求得讲解:XX252021/3/10 (2)有等式约束泛函极值的必要条件有等式约束泛函极值的必要条件定理定理 设有如下泛函极值问题:*()x t0()min(),(),).(),(),)0fttx tJg x tx tt dts tf x tx tt(6)已知x(t0)=x0,x(tf)=xf,则极值曲线 应满足如下欧拉方程和横截条件 0)(xFdtdxF00()()()()0ft tft t

10、FFx tx txx讲解:XX262021/3/10其中,为拉格朗日函数,是待定拉格朗日乘子。(),(),)(),(),)(),(),)TLx tx ttg x tx ttf x tx tt()ntR讲解:XX272021/3/104.1.3 横截条件横截条件末端时刻固定时的横截条件末端时刻固定时的横截条件当tf 固定时,在x(t0)=x0 固定时,横截条件为如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0,x(tf)=xf;当末端状态自由时,横截条件为0)()(ftttxxFfx(t0)=x0()0ft tFxx(t0)=x0 讲解:XX282021/3/10(2)末端

11、时刻自由时的横截条件末端时刻自由时的横截条件讲解:XX292021/3/10末端受约束时,存在如下近似关系:如果末端自由,则曲线c(t)不存在。设性能指标为容许轨线x(t)与极值曲线x*(t)之间有如下关系(7)讲解:XX302021/3/10当末端由(xf,tf)移动到 时,产生如下的泛函增量(,)ffffxxtt(8)讲解:XX312021/3/10将(8)右端的第二项在极值曲线泰勒展开对上式右端的第二项分部积分讲解:XX322021/3/10将以上结果代入(8),取增量的线性主部,得泛函的变分令 ,得欧拉方程和横截条件:0J(9)(10)讲解:XX332021/3/10末端时刻自由、末端

12、状态变动时的横截条件末端时刻自由、末端状态变动时的横截条件 1)末端状态自由时的横截条件末端状态自由时的横截条件当x(tf)自由时,由(7)可知代入(10)可得到因为 任意,所以tf自由、x(tf)自由的横截条件和边界条件为:,ffxt(11)讲解:XX342021/3/10 2)末端状态受约束时的横截条件末端状态受约束时的横截条件设受约束方程为 x(tf)=c(tf),由(7)可知代入(11),并考虑 任意,得到tf自由、x(tf)受约束的横截条件和边界条件为ft(11.1)讲解:XX352021/3/10n如果t0也自由、x(t0)受约束,即沿着曲线g(t)则应满足以下横截条件000*()

13、()()()(,)()0(,)()0fffTtTtx tg tx tc tLL x x tgxxLL x x tcxx(11.2)讲解:XX362021/3/10n例子例子:n求平面上给定两点A(0,1),B(1,3)间的最短弧长。n若B点可沿曲线 c(t)=2-t 移动,求一连接A、B两点且弧长最短的曲线。对于最短弧长最短弧长问题,它是泛函在两端固定条件下的变分问题,欧拉方程的解为 x=at+b带入边界条件可得解 x=2t+1。02()1fttJ x tx dt201dxdtx讲解:XX372021/3/10(2)属于末端受约束的变分问题,其最短弧长满足与(1)相同的欧拉方程,因此 x=at

14、+b,因为初始点没有变化,所以由x(0)=1可得b=1.为了确定参数a,运用横截条件(11.1)可得解得 a=1,因此 可知极值曲线为 .由末端约束条件 ,可知 tf=0.5,带入弧长公式得到最短弧长 221(1)01aaaa x=t+1()2ffx tt0.50.52002()11 12J x tx dtdt讲解:XX382021/3/10 不同边界情况下的横截条件不同边界情况下的横截条件讲解:XX392021/3/104.1.4 变分法解最优控制问题变分法解最优控制问题系统方程为性能指标为末端状态 x(tf)受约束,要求的目标集为最优控制问题是最优控制问题是:确定最优控制u*(t)和最优曲

15、线x*(t),使得系统(12)由已知初态 x0 转移到要求的目标集(14),并使性能指标(13)达到极值。(14)(13)(12)讲解:XX402021/3/10 可以利用拉格朗日乘子法将上述有约束条件的泛函极值问题化为无约束条件的泛函极值问题。(,)(,)()(,)TH x utL x u tt f x u t(15)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用。讲解:XX412021/3/10(1)末端时刻固定时的最优解末端时刻固定时的最优解对于如下最优控制问题:无约束且在t0,tf上连续,.在t0,tf上,f(.),和L(.)连续可微,tf固定。最优

16、解的必要条件为:1)x(t)和 满足正则方程,nmxR uR,rR rn(.),(.)()t讲解:XX422021/3/102)边界条件和横截条件3)极值条件证明:构造广义泛函讲解:XX432021/3/10分部积分则对上式取一次变分,考虑到根据泛函极值的必要条件,可得到结论。讲解:XX442021/3/10当末端时间tf固定,末端状态x(tf)自由时,不存在目标集因此,该下的泛函极值只需将上述结论中的 去掉即可。当末端时间tf固定,末端状态x(tf)固定时,正则方程不变,边界条件退化为x(t0)=x0,x(tf)=xf,系统在可控的条件下,极值条件也不变。讲解:XX452021/3/10讲解

17、:XX462021/3/10本例属于末端时刻固定,末端状态受约束的泛函极值问题。Hamilton函数协态方程极值条件讲解:XX472021/3/10状态方程根据初始条件和目标条件可求出 c3=c4=0,4c1-9c2=6再根据横截条件可求出c1=(1/2)c2,可求出c1与c2的值。进而获得最优解讲解:XX482021/3/10(2)末端时刻自由时的最优解末端时刻自由时的最优解 对于如下最优控制问题:最优解的必要条件为:1)x(t)和 满足正则方程()t讲解:XX492021/3/102)边界条件和横截条件3)极值条件4)在最优曲线末端的Hamilton函数满足讲解:XX502021/3/10

18、证明:构造广义泛函当末端由(xf,tf)移动到 时,产生如下的泛函增量将上式在最优轨线展成泰勒级数并取主部,应用中值定理并考虑 ,可得到(,)ffffxxtt讲解:XX512021/3/10()()TTTaffffffffJxtxtx ttx tt将 代入上式可得到令 得到定理的结论。讲解:XX522021/3/10Page562,表10-2 用变分法求最优解的必要条件讲解:XX532021/3/10例子:解:本例属于tf自由,末端状态固定、控制无约束的泛函极值问题。讲解:XX542021/3/10 =常数,再由极值条件得由状态方程和初始条件得到利用末态条件得到最后根据末端时刻H的变化率可以求

19、得 这样,求得的最优解为2a 讲解:XX552021/3/104.2 极小值原理及其应用极小值原理及其应用4.2.1 连续系统的极小值原理4.2.2 离散系统的极小值原理4.2.3 最小时间控制4.2.4 最小能量控制 为解决控制有约束的变分问题,庞特里亚金提出并证明了极小值原理,其结论与经典的变分理论有许多相似之处,而且不要求哈密尔顿函数对控制量连续可微。讲解:XX562021/3/104.2.1 连续系统的极小值原理连续系统的极小值原理末端自由时的极小值原理末端自由时的极小值原理定理定理 对于如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中 为任意分段连续函数;末端状态

20、自由;末端时刻固定或自由。假设 f(x,u)和 都是自变量 的连续可微函数,且在有界集上f(x,u)对变量x满足,nmxR uR()x1212(,)(,),0f x uf x ua xxa讲解:XX572021/3/10则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:正则方程正则方程其中边界条件与横截条件边界条件与横截条件极小值条件极小值条件4)沿最优轨线哈密尔顿函数变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)()t讲解:XX582021/3/10极小值原理与经典变分法的区别:极小值原理与经典变分法的区别:n容许控制条件放宽。极小值条件对通常的控制约束均适用。

21、n最优控制使哈密顿函数取全局极小值。当满足经典变分法的应用条件时,其极值条件是极小值原理中极值条件的特例。n极小值原理不要求哈密顿函数对控制向量的可微性。讲解:XX592021/3/10例子:解:已知由协态方程可得到讲解:XX602021/3/1022112(),()ttctc ec由横截条件解出由极小值条件由于可得到*1,0,1)()1tu tt 1,讲解:XX612021/3/10定理定理 对于如下时变系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:正则方程正则方程其中()t讲解:

22、XX622021/3/10边界条件与横截条件边界条件与横截条件极小值条件极小值条件4)沿最优轨线哈密尔顿函数变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)讲解:XX632021/3/10于是该问题就变成了如下定常问题:讲解:XX642021/3/10利用定常系统的结论,可知协态方程为即(17)(16)讲解:XX652021/3/10横截条件为即极小值条件为将式(16)代入可得即得结论3)。沿最优轨线哈密尔顿函数变化率将(18)代入可得到本定理的结论4)。(18)讲解:XX662021/3/10定理定理 对于如下定常系统、积分型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻

23、固定或自由,假设同前,则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:正则方程正则方程其中()t讲解:XX672021/3/10边界条件与边界条件与横截条件横截条件极小值条件极小值条件4)沿最优轨线哈密尔顿函数变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)讲解:XX682021/3/10于是该积分型问题就变成了如下末值型问题:讲解:XX692021/3/10把上面两个式子代入协态方程 ,可得讲解:XX702021/3/10因此由横截条件可知因为 ,上式可表示为由(19)可得0()()tHtx 常数(19)0()1()0ftt讲解:XX712021/3/10则哈密

24、尔顿函数为将它代入(19)可得从而也得到了极值条件3)和最优轨线末端应满足条件4)。讲解:XX722021/3/10解:该题属于定常系统、积分型性能指标、tf固定、末端自由、控制受约束的最优控制问题。令讲解:XX732021/3/10由协态方程解得再由横截条件 可以求出c=e。显然,当 时u*(t)产生切换,由 可以解出 =0.307,因此将u*代入状态方程并利用初值条件可得到最优轨线为()0ft()1st()11ststce st讲解:XX742021/3/10(2)末端受约束时的极小值原理末端受约束时的极小值原理定理定理 对于如下定常系统、末值型性能指标、末端受约束、控制受约束的最优控制问

25、题式中末端时刻固定或自由,假设同前,则必存在非零的 ,使如下必要条件成立:(),t讲解:XX752021/3/10正则方程正则方程其中边界条件与横截条件边界条件与横截条件极小值条件极小值条件4)沿最优轨线哈密尔顿函数变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)讲解:XX762021/3/10定理定理 对于如下时变系统、末值型性能指标、末端受约束、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则必存在非零的 ,使如下必要条件成立:(),t讲解:XX772021/3/10正则方程正则方程其中边界条件与横截条件边界条件与横截条件极小值条件极小值条件4)沿最优轨线哈密尔顿函数

26、变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)讲解:XX782021/3/104.2.2 离散系统的极小值原理离散系统的极小值原理末端约束时的离散极小值原理末端约束时的离散极小值原理定理定理 设离散系统状态差分方程为性能指标为式中 N 固定。假设 f(.),和 L(.)都是自变量 的连续可微函数,末端状态受如下目标集约束(.)()0 x N讲解:XX792021/3/10则对于最优序列u*,x*,必存在非零的 ,使如下必要条件成立:差分方程差分方程其中边界条件与横截条件边界条件与横截条件极小值条件极小值条件()k和讲解:XX802021/3/10若u(k)无约束,则极值条件为(2)

27、末端自由时的离散极小值原理末端自由时的离散极小值原理定理定理 设离散系统状态差分方程为性能指标为式中 N 固定。假设同前,末端状态自由,则对于最优序列u*,x*,必存在非零的 ,使如下必要条件成立:()k和讲解:XX812021/3/10差分方程差分方程其中边界条件与横截条件边界条件与横截条件极小值条件极小值条件若u(k)无约束,则极值条件为讲解:XX822021/3/10讲解:XX832021/3/10该题属于控制无约束问题,构造由协态方程可得到由极值条件讲解:XX842021/3/10得到将u*(k)代入状态方程并利用边界条件可得到讲解:XX852021/3/104.2.3 最小时间控制最

28、小时间控制最小时间的控制问题最小时间的控制问题设线性定常系统完全可控,求满足下列不等式约束的容许控制:使系统从初始状态x(0)=x0转移到x(tf)=0,并使性能指标极小,其中 tf 自由。讲解:XX862021/3/10(2)正常情况与奇异情况正常情况与奇异情况构造根据极小值条件,可得则设可知,(20)可表示为下式(20)讲解:XX872021/3/10(3)奇异性的充要条件奇异性的充要条件定理定理 设矩阵 式中bj中为矩阵B的列向量,当且仅当m个Gj矩阵 中至少有一个是奇异矩阵,上述最优问题是奇异的。定理定理 上述问题是正常的,当且仅当讲解:XX882021/3/10(3)Bang-Ban

29、g控制控制定理定理 对上述问题,若系统是正常的,则最优解的必要条件是正则方程正则方程其中边界条件边界条件极小值条件极小值条件讲解:XX892021/3/104)沿最优轨线哈密尔顿函数变化率沿最优轨线哈密尔顿函数变化率(tf自由时用自由时用)讲解:XX902021/3/104)经验证系统可控,因此系统正常。可用上述定理求解。由协态方程得取u*=1,可以求得系统的解,并消去变量t可得到最优轨线方程讲解:XX912021/3/10则满足末态要求的最优轨线方程可表示为取u*=-1,也可得到满足末态要求的最优轨线方程曲线 组成曲线 ,称为开关曲线,表示为开关曲线将相平面分成两部分R+和R-,讲解:XX9

30、22021/3/10讲解:XX932021/3/10则时间最优控制为讲解:XX942021/3/104.2.4 最小能量控制最小能量控制设线性定常系统求满足下列不等式约束的容许控制:使系统从初始状态x0转移到x(tf)=xf,并使性能指标极小,其中 tf 固定。讲解:XX952021/3/10构造定义开关向量函数由协态方程可得则开关向量可表示为讲解:XX962021/3/10其分量为则将上式代入哈密尔顿函数,可得若uj(t)无约束,则讲解:XX972021/3/10解出由控制约束条件可得出下面的最优控制律MtstsMMtstsujjjjj2)(),(sgn2)(),(21*讲解:XX98202

31、1/3/10解:构造讲解:XX992021/3/10则最优控制律应满足由协态方程可解出讲解:XX1002021/3/10因为末端固定,不能由横截条件确定c1,c2,这里采用试探法。通常情况下,如果使最小能量控制问题的控制量较小,首先选取线性最优控制函数,即将上式代入状态方程解得根据初始条件可得c3=c4=0。根据末态条件,可得讲解:XX1012021/3/10根据哈密尔顿函数沿最优轨线的变化率得将u(tf),x1(tf)和x2(tf)代入上式可得 c1-(c2-c1tf)2=0。综合以上方程,可以得出讲解:XX1022021/3/10因此,最优控制为经检验在0,tf区间上,满足u(tf)t0)

32、和相应状态x(t1),u*(t)、x*(t)仍是该系统的最优控制和最优轨线。讲解:XX1432021/3/10(2)动态规划的基本递推方程动态规划的基本递推方程问题问题:设N级决策过程的动态方程为式中,控制决策约束u(k),k=0,1,2,N-1;代价函数(性能指标)为假设f(.)和L(.)连续,L(.)正有界。求最优控制序列u(0),u(1),u(N-1),使代价函数极小。(35)讲解:XX1442021/3/10说明:说明:上述问题中,k表示N级决策过程中的阶段变量,x(k)表示第k+1级的初始状态,u(k)表示第k+1级采用的控制向量。问题中的假设是为了保证最优控制序列的存在。设有N-k

33、级决策过程讲解:XX1452021/3/10式中,j=k,N-1,u=u(k),u(N-1).则始自第k级任一容许状态x(k)的最小代价为上式中右端第一项是第k级所付出的代价;第二项是从第k+1级到第N级的代价和。因此式中求极小的运算分讲解:XX1462021/3/10为两部分:在本级决策u(k)作用下求极小,以及在剩余决策序列u(k+1),u(N-1)作用下求极小,则上式变为(36)讲解:XX1472021/3/10根据最优性原理,如下关系成立将上式代入(36)得到动态规划基本递推方程利用上式求解最优控制序列时,从过程的最后一项开始,逐级逆向递推:首先令k=N-1则由式(37)可得到(37)

34、讲解:XX1482021/3/10式中J*xN,N表示代价函数中的末项值。对于(35)问题,代价函数中无末值项,J*xN,N=0,故式(38)为单级最优决策问题。令k=N-2,则由式(37)可得到式中J*x(N-1),N-1已由式(38)确定,因此上式也是一个单级最优决策问题。(38)讲解:XX1492021/3/10根据(37)逆向逐级递推,最后可以得到J*x(0),0.最后一步的递推解及最优策略正是我们要求的最优解。式中的状态及控制均不受约束。求最优控制序列u*(0),u*(1),u*(2),使代价函数极小。讲解:XX1502021/3/10解:本题属于N=3级最优决策问题。根据递推方程(

35、37)令k=2根据代价函数的末值项及系统方程,有所以因为u(k)无约束,令可得讲解:XX1512021/3/10令k=1可得令k=0可得讲解:XX1522021/3/10代入已知的x(0),按正向顺序求出因此最优控制、最优轨线及最优代价为讲解:XX1532021/3/10采用离散动态规划方法,可以方便地求出控制与状态变量均有约束时离散系统的最优控制问题。离散最优控制问题的动态规划解离散最优控制问题的动态规划解设非线性离散系统的状态差分方程为其中,k=0,1,N-1.代价函数为求最优控制序列u*(k),使代价函数最小。4.4.2 离散动态规划离散动态规划(39)讲解:XX1542021/3/10

36、根据动态规划的基本递推方程,分以下步骤进行求解:求第求第N级最优控制级最优控制u*(N-1)求出 求第求第N-1级最优控制级最优控制u*(N-2)求出 讲解:XX1552021/3/10求第求第k+1级最优控制级最优控制u*(k)求出 求第求第1级最优控制级最优控制u*(0)求出 讲解:XX1562021/3/10再由已知初值x(0),顺序求出u*(0),x*(1),u*(N-1),x*(N-1).讲解:XX1572021/3/10解:本题为N=4级最优控制问题。令k=3讲解:XX1582021/3/10令k=2讲解:XX1592021/3/10令k=1讲解:XX1602021/3/10令k=

37、0讲解:XX1612021/3/10最优解为:4.4.3 连续动态规划连续动态规划连续系统的最优控制问题连续系统的最优控制问题 设连续系统的状态方程为性能指标为讲解:XX1622021/3/10控制u(t)有界;在t0,tf上,f(.),L(.)连续且可微;并假设以t为初始时刻,tt0,tf,x(t)为初始状态时,函数J(x,t)连续,且对x(t)和t有连续的一阶和二阶偏导数。求在容许控制域中,确定最优控制u*(t),使性能指标最小。为了求上述问题的最优解,除了可以采用极小值原理外,还可以用连续动态规划法,该方法的数学基础为哈密尔顿-雅可比方程。(2)哈密尔顿哈密尔顿-雅可比方程雅可比方程设在

38、区间t,tf上,控制函数ut,tf存在,则最优性能指标为(.)讲解:XX1632021/3/10由于 与ut,t+t无关,由最优性原理所以),(),(min),(*,*ttttxJdttuxLtxJttttttu讲解:XX1642021/3/10右端第一项由中值定理得第二项展成泰勒级数其中O(t2)是关于t的高阶小量,将这两项代入原式可得讲解:XX1652021/3/10令t0得到哈密尔顿-雅可比方程的第一种形式当u(t)不受约束时,构造令 ,可得到最优控制的隐含形式(40)讲解:XX1662021/3/10将上式代入(40)可得该偏微分方程的边界条件为上两式构成了哈密尔顿-雅可比方程的第二种

39、形式。(41)(42)讲解:XX1672021/3/10(3)连续动态规划的基本方程连续动态规划的基本方程当控制u(t)受约束时,由哈密尔顿-雅可比方程的第一种形式可得连续动态规划的基本方程则最优解的充分条件可表示为利用上式求解连续动态规划问题的步骤可以总结如下:(43)讲解:XX1682021/3/101)求解最优控制的隐式解。求解最优控制的隐式解。当控制u(t)受约束时,在约束范围内取遍u(t)使得求出当u(t)无约束时,则由 求出上述隐式解。2)求最优性能指标。求最优性能指标。将 代入哈密尔顿函数可得到讲解:XX1692021/3/10则最优指标为微分方程及边界条件的解。3)求最优控制的

40、显式解。求最优控制的显式解。由求出的J*(x,t)计算 并代入 ,得到最优控制的显式解。讲解:XX1702021/3/104)求最优轨线。求最优轨线。将求出的最优控制并代入状态方程,解出最优轨线x*(t)。讲解:XX1712021/3/10解:解:本题为无限时间定常状态调节器问题,采用连续动态规划求解时,可以按照下面的步骤进行计算:求最优控制的隐式解。可知2)求最优性能指标J*x(t)。将上面的控制代入哈密尔顿函数讲解:XX1722021/3/10由于本题属于线性二次型问题,可以假设则因此哈密尔顿-雅可比方程为上式对所有非零x(t)都成立,则可以解出讲解:XX1732021/3/10则最优性能指标为令t=0,代入初始状态条件可得 J*x(0)=1。3)求u*(t)的显式解。4)求x*(t)。将u*(t)代入状态方程,得到闭环系统方程,然后解出方程的解即得到最优轨线x*(t)。通过计算,得到2021/3/10174感谢您的阅读收藏,谢谢!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!