线性系统二次型指标的最优控制线性二次型问题

上传人:san****019 文档编号:22675021 上传时间:2021-05-30 格式:PPT 页数:108 大小:2.04MB
收藏 版权申诉 举报 下载
线性系统二次型指标的最优控制线性二次型问题_第1页
第1页 / 共108页
线性系统二次型指标的最优控制线性二次型问题_第2页
第2页 / 共108页
线性系统二次型指标的最优控制线性二次型问题_第3页
第3页 / 共108页
资源描述:

《线性系统二次型指标的最优控制线性二次型问题》由会员分享,可在线阅读,更多相关《线性系统二次型指标的最优控制线性二次型问题(108页珍藏版)》请在装配图网上搜索。

1、第五章 线性系统二次型指标的最优控制 线性二次型问题返 回 主 目 录 n 5.1 引言n 5.2 线性二次型问题的提法n 5.3 终端时间有限时连续系统的状态调节器问题n 5.4 稳态时连续系统的状态调节器问题n 5.5 离散系统的线性二次型问题n 5.6 伺服跟踪问题n 5.7 设计线性二次型最优控制的若干问题n 5.8 小结 5.1 引言 用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最少燃料这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把 表示为 的函数)也是非常困难的。)(tX)(tU 返回子

2、目录 的确定归结为求解一个非线性矩阵黎卡提(Riccati)微分方程或代数方程。而黎卡提方程的求解已研究得很透彻,有标准的计算机程序可应用,因此,求解既规范又方便。这种问题简称为线性二次型(Linear Quadratic 简称LQ)问题,目前应用得十分广泛,是现代控制理论最重要的结果之一。)(tG 下面我们将看到,若系统是线性的,指标函数是二次型的(指标函数是 和 的二次函数),则可以求得线性最优反馈控制律 。 )(tX )(tU )()()( tXtGtU 线性二次型问题的实用意义还在于: 例如,在飞行器的轨迹优化问题中,根据飞行器的状态方程(一般是非线性的)用极小值原理计算出名义的最优控

3、制和最优状态轨迹,设分别 用 和 表示。)( 0 tX )(0 tU 把它所得到的最优反馈控制与非线性系统的开环最优控制结合起来,可减小开环控制的误差,达到更精确的控制的目的。 因为状态方程只能是对飞行器实际动力学特性的近似描绘,这里存在着模型误差,把 加到飞行器上去,所产生的实际状态 将不同于 (这里我们还未考虑作用在飞行器上的其它扰动作用)。(这里我们还未考虑作用在飞行器上的其它扰动作用)。)(0 tX)(tX )(0 tU 令状态误差为 ,我们要使 愈小愈好,为此,可根据 构成一个最优反馈控制 ,作为校正信号加到 上去,得到的实际控制信号 将使飞行器尽可能沿着 飞行。)(0 tX)()(

4、)( 0 tUtUtU )(0 tU)(tU )(tX)()()( 0 tXtXtX )(tX 由于 、 应该比较小,它们将满足线性的状态方程,所以可用线性二次型问题设计出反馈控制 。我们可用图5-1表示上面的思想。)()()( tXtGtU )(tU)(tX n 图5-1 线性二次最优反馈控制的应用 5.2 线性二次型问题的提法n一般情况的线性二次型问题可表示如下:其 中 , 为 维 状 态 向 量 , 为 维 控 制 向 量 , 为 维 输 出 向 量 。 设 不 受 约 束 。)(tU )(tY)(tX )(tU ml n设 线 性 时 变 系 统 的 方 程 为 )()()()()(

5、tUtBtXtAtX ( 5-1))()()( tXtCtY ( 5-2)返回子目录 其 中 , 为 维 理 想 输 出 向 量 。 寻 找 最 优控 制 , 使 下 面 的 性 能 指 标 最 小l)(tZ ftt TTffT dttUtRtUtetQtetPeteuJ 0 )()()()()()(21)()(21)( ( 5-4)令误差向量 为)(te )()()( tYtZte ( 5-3)其中, 是 对称半正定常数阵, 是 对称半正定阵, 是 对称正定阵。 一般将 、 、 取成对角阵。)(tR)(tQP l l)(tR )(tQl lP m m 下面对性能指标 中的每一项作一说明。因

6、为正定阵,则当 ,就有 。例如0)()()( tUtRtU T0)( tU )(tRJ )(0 0)()( 21 trtrtR )( )()( 21 tu tutU dttutrtutrdttUtRtU ff tttt T 00 )()()()(21)()()(21 222211设 , ,则 为正定阵,于是)(tR0)(2 tr0)(1 tr 它与消耗的控制能量成正比,消耗得越多,则性能指标值 越大。故性能指标中这一项表示了对消耗控制能量的惩罚。 、 可看作加权系数,如认为 的重要性大于 ,则可加大 。将 选成时间函数,是为了对不同时刻的 加权不一样。实际上,为了简单起见常选用常数阵 。R)(

7、tU )(tR)(1 tr)(2 tu)(1 tr )(2 tr)(1 tu J 为半正定阵,则当 ,就有 , 表示误差平方和积分,故这项表示对系统误差的惩罚。 表示对终端误差的惩罚,当对终端误差要求较严时,可将这项加到性能指标中。)()(21 ffT tPetedttetQteftt T )()()(21 00)()()( tetQteT 0)( te)(tQ 总之,性能指标 最小表示了要用不大的控制量来保持较小的误差,以达到能量和误差的综合最优。)(uJ 这时 (单位阵),理想输出 ,则 ,这时,问题归结为用不大的控制量使 保持在零值附近。因而称为状态调节器问题。)()()( tetXtY

8、 0)( tZ ItC )()(tXn下面讨论几种特殊情况:1)调节器问题。 例如电机转速调节系统中,由于外加电压波动使转速偏离要求值,通过施加控制使转速偏差趋于零。 这时 , ,这时要用不大的控制量使 跟踪 ,因而称为跟踪问题。例如,用雷达跟踪飞行器的运动,通过控制使跟踪误差趋于零。)(tZ)(tY )()()( tYtZte 0)( tZn 2) 伺服机问题。 5.3 终端时间有限时连续系统的状态调节器问题要求寻找最优控制 ,使 最小。这里 无约束。 、 为对称半正定阵, 为对称正定阵。终端时间 为有限值。 ft )(tR)(tQP )(tU J )(tU )()()()()( tUtBt

9、XtAtX 00 )( XtX (5-5)()(21 ffT tPXtXJ ftt TT dttUtRtUtXtQtX0 )()()()()()(21 (5-6)J考虑下面的系统状态方程和性能指标 返回子目录 5.3.1 用极小值原理求解上面的问题因 无约束,故等同于用经典变分法求解。取哈密顿函数为)(tU协态方程为最优解的必要条件如下: )()()()()( tUtBtXtAt T )()()()()()(21 tUtRtUtXtQtXH TT (5-7) )()()()( ttAtXtQXH T (5-8) )()()(1 ttBtRU T 因 正定,故 存在,由上式可确定最优控制 。为寻

10、求最优反馈控制律还需把 与状态 联系起来。)(tX )(tU )(1 tR)(tR )(tU0)()()()( ttBtUtRUH T (5-9)控制方程为 我们再一次遇到了两点边值问题(已知 和 ),如前所述,一般要试凑 再积分协态方程使 满足要求。)( 0tX)( ft )( 0t)( ft 但这里处理的是线性微分方程,可找到更简单的解法。从(5-10)可见,协态 和状态 在终端 时刻成线性关系。ft )(tX)(t )()()(21)()()( fffTfff tPXtPXtXtXtXt (5-10) 横截条件为 然后再来求出 (这种方法称为扫描法)。将(5-11)代入(5-9),再代入

11、(5-5),得)(tK )()()( tXtKt (5-11))()()()()()()()( 1 tXtKtBtRtBtXtAtX T (5-12)()()()()()()()()()( tXtKtAtXtQtXtKtXtKt T (5-13)由(5-11)和(5-8)可得 这启发我们假定: 上式对任意 都应成立,故方括号内的项应为零,这就得出)(tX 0)()()()( tXtQtKtAT )()()()()()()()( 1 tKtBtRtBtKtAtKtK T )()()()()()( 1 tQtKtBtRtBtK T ( ) ( ) ( ) ( ) ( )TK t K t A t A

12、 t K t (5-14)将(5-12)代入(5-13)可得 上式是 的非线性矩阵微分方程,称为黎卡提(Riccati)矩阵微分方程。一般来说得不出 的解析表达式,但可用计算机程序算出 的数值解。为了求解 ,要知道它的边界条件。比较(5-11)和(5-10)可知)(tK )(tK)(tK)(tK 因此可从 到 逆时间积分黎卡提微分方程,求出 。由(5-9)和(5-11)就可构成最优反馈控制 ft 0t)(tK PtK f )( (5-15) 又称为最优反馈增益矩阵。最优反馈系统的结构图如图5-2所示。)()()()( 1 tKtBtRtG T )()()()()()()( 1 tXtGtXtK

13、tBtRtU T (5-16) 图5-2 最优反馈系统的结构图 注意到 与状态 无关,故可在系统未运行前,将 先计算出来(称为离线计算),把它存储在计算机中。)(tK )(tX)()()(1 tKtBtR T 在系统运行时,将 从计算机存储元件中取出,与同一时刻测量到的 相乘,就可构成最优控制 。)()()(1 tKtBtR T )(tX)(tU 由此可见,系统运行时的计算量(称为在线计算量)只是一个乘法计算,故可用简单的微计算机来完成。 5.3.2 矩阵黎卡提微分方程的求解及的性质1、t tKttKdttdK t )()(lim)( 0于是可用下面的差分方程来近似黎卡提微分方程 )()()(

14、)()()( tKtAtAtKttKttK T )()()()()()( 1 tQtKtBtRtBtK T (5-17) 矩阵黎卡提微分方程是非线性的,一般不能求得闭合形式的解。在数字机上求解时,可用一阶差分代替微分 2、 求解上式时,以 为初始条件,取 为负的小量,从 到 逆时间递推计算,即可出 。PtK f )( tft 0t )(tK 是对称矩阵,即 , 表示转置。这可证明如下:因为 、 、 都是对称的,将(5-14)式转置一下,可得)(tK )()( tKtK T TP )(tQ )(tR )()()()()()( tKtAtAtKtKtK TTTTT )()()()()()( 1 t

15、QtKtBtRtBtK TTT 因此 和 一样满足同一黎卡提方程,并且边界条件一样,即 。于是,由微分方程解的唯一性可知)(tKT )(tK )()( ffT tKPtK )()( tKtKT 利用这个对称性,求 维 的元时,只需积分 个方程即可。)(tK2 )1( nn nn n 3、 即使系统是定常的,即系统矩阵A,输入矩阵B为常数阵,加权阵 和 也是常数阵,但 仍为时变阵。QR )(tK 这从 是黎卡提微分方程的解可看出。 时变时,反馈控制增益也时变,在实现时总是不太方便。)(tK )(tK 下一段将看到,对线性定常系统,若终端时间 ,且系统满足一些附加条件时, 将变为常数阵 。 ft

16、K )(tK 例5-1 设系统状态方程为0)0(22 xux 1)0(121 xxx(5-18) ft dttutxJ 0 221 )()(21(5-19)寻找最优控制 使下面的性能指标为最小。( )u t 解考虑到 是对称阵,设)(tK 为简单起见,上式右端省略了自变量 。把上面的 、 、 、 和 代入黎卡提方程(5-14)式,可得 A B Q R )(tK t1,00 01,0,10,00 10 RQPBA(5-20) 2212 1211)( kk kktK(5-21) 把状态方程(5-18)和(5-5)式相比较,把性能指标(5-19)和(5-6)式相比较,可得 2212 12112212

17、 12112212 1211 01 0000 10 kk kkkk kkkk kk 21211 1 kk 22121112 kkkk 令上式等号左右端的对应元相等,得 00 011010 2212 12112212 1211 kk kkkk kk 2221222 2 kkk (5-23) 22212122211 221211212 2,1 kkkkk kkkk(5-22) 由 到 逆时间积分上面的非线性微分方程组,即可求得 。于是最优控制为ft 0t )(),(),( 221211 tktktk )( )(101)()()( 212212 12111 tx txkk kktXtKBRtu T

18、)()()()( 222112 txtktxtk 0)( PtK f(5-24)0)()()( 221211 fff tktktk得(5-25)这是一组非线性微分方程。由边界条件 、 、 、 和 随时间变化的曲线可求出,如图5-3(a)、(b)、(c)所示。)(12 tk )(22 tk )(1 tx )(2 tx )(tu图5-3 、 、 、 和 的时间曲线 )(12 tk )(22 tk )(1 tx )(2 tx )(tu 由图5-3可见,定常系统的反馈系数 、 都是时变的。当 比系统的过渡过程时间大很多时, 、 只在接近 时才有较大的变化,其它时间接近于常数。当 时, 、 和 都趋于零

19、,则黎卡提微分方程变为黎卡提代数方程11k 12k 22kft ft)(22 tk )(12 tk ft )(12 tk )(22 tk2 1210 k 2212110 kkk 2221220 kk 解上面的方程组可得 、 、 的稳态值22k12k11k 212 221211 kkk于是最优控制律可表示为)(2)()( 21 txtxtu (5-27)最优控制系统的结构图如图5-4所示。 图5-4 重积分系统最优控制的结构图 5.4 稳态时连续系统的状态调节器问题 对于稳态问题,当系统状态方程和性能指标中的加权阵满足一定条件时,可得出常数的最优反馈增益阵,这样在实现时非常方便,因此有很大的实际

20、意义。 我们不加证明地列出下面的结果,然后再对问题中的条件作一些说明。 现在来研究工程实践中经常碰到的情况:系统是定常的,积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。 返回子目录 为 维, 为 维,系统是可控的或至少是可稳的(可稳指不可控的状态是渐近稳定的)。性能指标为X n U m )()()( tBUtAXtX (5-28) 0 )(21 dtRUUQXXJ TT(5-29)线性定常系统 其中 不受约束, 和 为常数对称正定阵。或者可将对 的要求改为对称半正定, 可观测,或至少可检测(可检测指不可观测的状态是渐近稳定的), 是 的矩阵平方根:。U Q R ),( 1QAQ 1Q

21、 Q 上节我们已经证明了:使 为 极小的最优控制是存在和唯一的,且可表示为:J)()()( 1 tGXtKXBRtU T (5-30) 其中 为 维常数阵,称为反馈增益阵, 为 维正定对称阵,满足下面的矩阵黎卡提代数方程G nm Knn 对照有限时间调节器的公式(5-14)可见,令 ,并将时变阵换成常数阵即得到(5-31)式。在5.5中将针对离散型系统求取与(5-30)对应的线性二次型状态调节器的控制规律。0)( tK 01 QKBKBRKAKA TT(5-31) 可以看到,与有限时间的调节器不同,稳态调节器问题附加了两个条件:系统可控或至少可稳; 为对称正定阵,或 对称半正定并且 可观,至少

22、可检测, 。下面对这些条件作些解释。QQ ),( 1QA11 QQQ T 也就是受控系统的状态变量必须是渐近稳定的(这时由 产生的反馈控制 也收敛到零)。)(tU)(tX 因为稳态问题的性能指标积分上限为无穷,为了保证积分值为有限, 和 要收敛到零。)(tX )(tU1)系统可控或至少可稳。这个要求是为了保证性能指标的积分为有限值(不趋于无穷)而提出的。 如果系统可控,则通过状态反馈可任意配置闭环系统极点,使系统渐近稳定。可控的条件可减弱为可稳,即不可控的状态是渐进稳定的。对有限时间调节器来讲,因为积分上限 为有限值,即使系统不可控,状态变量不稳定,但积分指标仍可为有限值,故仍旧有最优解。ft

23、 2) 为正定或 为半正定并且 可观测至少可检测, 。Q Q ),( 1QA11 QQQ T 这个条件是保证最优反馈系统稳定而提出的,因性能指标 取有限值,还不能保证系统稳定。J 例如只要不稳定的状态变量在性能指标中不出现(未被指标函数所“观测”到)即可。 为半正定时就可能出现这种情况,所以 必须正定。或者半正定,但还有 可观,至少可检。下面用例子来说明。QQ),( 1QA 例5-2 已知系统方程 要寻找最优控制使 最小。J )()()( tutaxtx (5-32)性能指标是 0 22 )()(21 dttrutqxJ(5-33) 解 设 ,即未控系统是不稳的,但系统是可控的。若 , ,即

24、、 为正定。黎卡提代数方程(5-31)化为0a 0q 0r q r 01 qKrKaKKa 022 rqraKK 2arqrarK (5-34)2arqrarK (5-35)取正定解 )(1)( tKxrtu 01 2 arqKra 由(5-30)求得最优控制代入状态方程(5-32),得闭环特征根变为即最优反馈系统是稳定的。)(1)( txKratx (5-37) 0 2 )(21 dttruJ 从 的形式立即可判断出 时 最小。这时无反馈控制作用,系统保持为开环不稳定。从黎卡提方程来看,这时有J J0)( tu022 raKK 有两个解: 和 。只有 可使 ,从而性能指标为最小,但这时系统不

25、稳定。0K 02 arK 0K0u若 (相当于为半正定),则指标蜕化为0q 例5-3 考虑下面的不可控系统要求出最优控制使 为最小。J )()()( 21 tutxtx (5-38))()( 22 taxtx (5-39) dttutxJ 0 221 )()((5-40)性能指标为 解 显然,这个系统的 是可控的,而 不可控,性能指标中只包含了可控的状态变量 。由状态方程和性能指标求得1x)(1 tx )(2 tx显然 为半正定阵。可控性阵为Q 1,00 01,01,0 10 RQBaA(5-41) 00 01, ABB(5-42) 由 对构成的可观性阵为),( 11 AQ 2212 1211

26、 kk kkK 11010100 01 QQT是非奇异阵,故 为可观测对。令),( 1QA是奇异的,系统不可控。将 阵作下面的分解Q 10 01, 11 TTT QAQ(5-43) 01 211 k022 2122212 kakk为保证 正定,根据塞尔维斯特判据, 的各阶主子式应大于零,即K K代入矩阵黎卡提代数方程(5-31)可得由上式可解得012121111 akkkk(5-44) 21222112211 00 kkkkk (5-45)2221211 )1(2 121 11 aa akakk (5-46) 将求得的 、 、 的值代入上面正定性条件,可得11k 12k 22k 若 ,则上式将

27、导致 ,发生矛盾若 ,则 可成立, 可正定。而由(5-39), 时,不可控的状态 是稳定的,即系统满足可稳的要求,于是存在正定的最优反馈增益阵 。0a 01 0a12 12 aa K 0a)( 2 tx K12 12)1( 1)1(2 12 22 aaaaa a或(5-47) )(1 1)()()( 21212111 txatxtxktxk )(1)()( 211 txaatxtx 最优控制可计算如下 )( )(01)()( 212212 12111 tx txkk kktKXBRtu T(5-48))()( 22 taxtx (5-49)最优闭环系统为 当 时,闭环系统也是稳定的0a闭环系统

28、矩阵为它的特征根为 a aaKBBRAA TCL 0 111(5-50)a 21 1 (5-51) 5.5 离散系统的线性二次型问题 先考虑一般的线性时变离散系统在终端时间有限时的状态调节器问题,再考虑线性定常离散系统在终端时间无限时的稳态状态调节器的问题 返回子目录 5.5.1 终端时间有限的状态调节器问题设系统状态方程为二次型性能指标为 10 )()()(21)()()(21 Nk TT kXkQkXNXNPNXJ )()()( kUkRkU T(5-53))()()()()1( kUkBkXkAkX 0)0( XX (5-52) 、 为半正定阵, 为正定阵。要求寻找最优控制序列 ,使 最

29、小。)(NP )(kQ )(kR)(ku J写出哈密顿函数协态方程)()()(21)()()(21)( kUkRkUkXkQkXkH TT )()()()()1( kUkBkXkAk T (5-54))1()()()()( )()( kkAkXkQkX kHk T (5-55) )()()(21)()()( NXNPNXNXNXN T 0)1()()()()( )( kkBkUkRkU kH T 横截条件为控制方程为假设)()( NXNP(5-56))1()()()( 1 kkBkRkU T (5-57))()()( kXkKk (5-58) )()()()()1( kUkBkXkAkX )1

30、()1()()()()()( 1 kXkKkBkRkBkXkA T )()()1()()()()1( 11 kXkAkKkBkRkBIkX T 把上式代入(5-59)并消去等式两端的 ,可得 必须满足下面的黎卡提矩阵差分方程)(kX)(kK把(5-58)代入协态方程(5-55)得由状态方程(5-52)和控制方程(5-57)可得 所以)1()1()()()()()( kXkKkAkXkQkXkK T(5-59) )1()()(,)(, 1 kKkBkRCkBBIA T 111111 )()( CABCAIBAABCA对上式方括号部分应用矩阵求逆引理。令可得矩阵黎卡提差分方程的另一形式 )()1(

31、)()()1()()()()1()( 1 kAkKkBkBkKkBkRkBkKkA TTT )()1()()()( kAkKkAkQkK T (5-61)IkKkAkQkK T )1()()()( )()1()()()( 11 kAkKkBkRkB T (5-60) 从 开始反向递推计算(5-60)即可决定 。求出 后,下面来决定 。由(5-55)得Nk )(kK )(kK)(kU )()()()()1( 1 kXkQkkAk T )()()()( kXkQkKkA T 黎卡提方程的终端条件为因而由(5-57)得)()( NPNK (5-62) )()()()()()()( 1 kXkQkKk

32、AkBkRkU TT (5-63) )()()1()()()()1()()()( 111 kXkAkKkBkRkBIkKkBkRkU TT .)1()()()()1()()( 111 kKkBkRkBIkKkBkR TT )()()1()()()()1()()()( 11 kXkAkKkBkRkBkKkBkRkBI TT )()()()1()()()()1()()( 1111 kBkRkBkKkBkRkBIIkKkBkR TTT )()()1( kXkAkK 1111 )1()()()()1()()()( kKkBkRkBIkKkBkRkR TT )()()1()()()( 1 kXkAkKk

33、BkRkB T 式(5-63)可化为另一形式,将(5-60)代入(5-63)并利用(5-61)得 取 可得)(),1()(,)( kBCkKkBBkRA T )()()1()()()1()()()( 1 kXkAkKkBkBkKkBkRkU TT 对上式花括号内引用前面的矩阵求逆引理)(kL 是最优反馈增益阵。)()( kXkL(5-64) )()1()()()1()()()( 1 kAkKkBkBkKkBkRkL TT (5-65) n例5-4 设系统状态方程为 n解要求寻找最优序列 、 ,使 最小。)0(u )1(u J 从给定的系统方程可见,系统矩阵 ,输入矩阵 。1)( kA1)( k

34、B )()()1( kukxkx )0(x给定 (5-66)性能指标为 10 22 )(21)2(21 k kucxJ(5-67) 从给定的性能指标可知加权阵 , , 。黎卡提方程(5-60)可写成cNP )( 0)( kQ 1)( kR )()()()()1()()()( 111 kAkBkRkBkKkAkQkK TT 终端值 。由 反向计算,求出 、 。cPK )2()2( 2k)1(K )0(K 1)1( )1(1)1( 11 kK kKkK(5-68) 11)2( )2()1( c cKKK(5-69) 再利用(5-63)式计算 , ,1。)(ku 0k)1(u再计算121)1( )1

35、()0( ccKKK(5-70))0(12)0()0()0( xccxKu (5-71))0(12 1)0()0()1( xccuxx (5-72))0(12)1(1)1()1()1( xccxccxKu (5-73) 1( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )T TU k R k B k A k K k Q k X k K k X k 5.5.2 稳态状态调节器问题 为 维状态向量, 为 维输入向量。性能指标为X n U m设系统的状态方程为)()()1( kBUkAXkX (5-74) 0 )()()()(k TT kRUkUkQXkXJ(5-75) 假设(

36、)可控或可稳, 为对称正定的常数阵,为对称正定的常数阵,或 为对称半正定常数阵,但 可观测或可检测, 。要求寻找最优控制使 最小。BA, RQQ ),( 1QA 11 QQQ TJ 可以证明,对于上面的问题,最优控制是存在和唯一的,它可以表示为)()( kLXkU (5-76) L为mn维的常数反馈增益阵,参考(5-65),将时变阵换成常数阵,L可表示为 其中K为nn常数阵,是下面的矩阵黎卡提代数方程的唯一的对称正定解。在(5-61)的矩阵黎卡提差分方程中,将时变阵换为常数阵,即可得出矩阵黎卡提代数方程为KABKBBRL TT 1)( (5-77) 0)( 1 KABKBBRKBAKAAQK

37、TTTT(5-78) 例5-5 系统的状态方程为 它是渐近稳定的,即 的特征值的模小于1。 A BL最优反馈控制系统为下面用例子来说明上述结果的应用。性能指标为)()()1( 22 kukxkx )()1( 21 kxkx (5-80) )()1( kXBLAkX (5-79) 0 221 )()(k kukqxJ(5-81) n解 , , , (5-82) 10 10A 10B 00 0qQ 1R因 非奇异,故系统可控。 11 10, ABB当 为半正定,故有下面的分解Qq ,0寻找最优控制使 最小。 由状态方程(5-80)和性能指标(5-81)可求得下面的矩阵J 0000 0 qqqQ 0

38、1 qQT qqQAQ TTT 0 011即 (5-83)非奇异,故 对可观测。于是满足稳态状态调节器问题的条件。由(5-78)),( 1QA KAAT kkkqkk kk 2212112212 1211 20 0000 0 KABKBBRKBA TTT kkkkk 2212222212 01 10 1 00 00 2221 1211 kk kkK令 ,黎卡提方程可写成 112 22 222 ( )1( ) ( ) 0 ( )1 x kU k LX k k k x kk )(42 4)(1 )( 222222 2212 kxqqq qqqkxk kk 由上式可解得由(5-76)、(5-77)可

39、得 )4(210 0 22212 1211 qqqqkk kkK(5-84) 222212101010 10 kkkBLAACL 221 10 10 k )4(21 222 qqqk 22221210 kkkL最优反馈增益阵闭环系统的系统矩阵为 闭环特征根为 。2221 1 1,0 k 显然,根的模都小于1,闭环系统稳定。由状态方程(5-80)可见,开环系统的根为 ,系统不是渐近稳定的。1,0 21 当 ,于是 ,闭环系统不是渐近稳定的,这是由于 不满足可观性条件,即(5-83)式为奇异阵,这时稳态状态调节器的最优控制解是不存在的。0q 1,0 222 k 0q 0, 222 k此外,当 ,则

40、有 。q 5.6 伺服跟踪问题其中,为 维,为 维,为 维。设理想输出为 ,跟踪误差 为X n U m Y q)(tZ )(te设系统的状态方程和输出方程为)()()()()( tUtBtXtAtX 00 )( XtX (5-85))()()( tXtCtY (5-86) )()()( tYtZte (5-87)返回子目录 寻找控制 ( 不受约束)使下列性能指标最小u u其中 为正定阵, 、 为半正定阵, 给定。)(tR P )(tQ ft跟踪问题的哈密顿函数为 ftt TTffT dttUtRtUtetQtetPeteJ 0 )()()()()()(21)()(21(5-88) )()()(

41、)()()()(21 tXtCtZtQtXtCtZH T )()()()()()()()(21 tUtBtXtAttUtRtU TT (5-89) 0)()()()( ttBtUtRUH T 因U无约束,由控制方程由协态方程得出)()()( tZtQtC T )()()()()()()()( ttAtXtCtQtCtXHt TT (5-91))()()()( 1 ttBtRtU T 可得(5-90) )()(21)()()( ffTfff tPetetXtXt 由上式可见 中有一项与 成线性关系,另一项与理想输出 成线性关系。根据扫描法的思想,令)( ft )( ftX)( ftZ由横截条件得

42、 )()()()( ffffT tZtXtCPtC (5-92))()()()( tgtXtKt (5-93) 其中矩阵 和向量时间函数 待定。将(5-93)式对t微分,得)(tg)(tK 设法从上式中消去 ,为此把(5-90)和(5-93)代入状态方程(5-85),可求出)(tX将(5-95)代入(5-94),即得)()()()()()( tgtXtKtXtKt (5-94))()()()()()()()()()()( 11 tgtBtRtBtXtKtBtRtBtAtX TT (5-95) )()()()()()( 1 tgtgtBtRtBtK T )()()()()()()()()()(

43、1 tXtKtBtRtBtKtAtKtKt T (5-96)另外,(5-93)代入(5-91)可得)()()( tZtQtCT )()()()()()()()()( tgtAtXtKtAtCtQtCt TTT (5-97)(5-96)减去(5-97)可得 )()()()()()()()()()(0 1 tKtBtRtBtKtKtAtAtKtK TT 上式对任意的 、 均应成立,于是可得)(tX )(tZ )()()()()()()()()()( 1 tgtAtBtRtBtKtXtCtQtC TTT )()()()( tZtQtCtg T (5-98))()()( tCtQtC T )()()(

44、)()()()()()()( 1 tZtQtCtgtAtBtRtBtKtg TTT (5-99) )()()()()()()()()()( 1 tKtBtRtBtKtKtAtAtKtK TT (5-100) )()()()( ffff tgtXtKt )()()()()()( ffTfffTf tPZtCtXtPCtCt 上面的微分方程组的边界条件可推导如下:由(5-93)得而由(5-92)得比较上面两式,可得)()()( ffTf tPCtCtK (5-101))()()( ffTf tPZtCtg (5-102) 由上面的 时的边界条件出发,逆时间积分(5-99)和(5-100)即可求出

45、、 。于是,最优控制可根据(5-90)和(5-93)求得为ft )(tK )(tg 中一项与状态 成正比(同状态调节问题),另一项与时间函数 成正比,而 是与理想输 出 有关的,故它表示了跟踪 的驱动作用。)(tU )(tX )(tg )(tg)(tZ)(tZ )()()()()()( 1 tgtXtKtBtRtU T (5-103) 值得指出的是:为了求出当时时刻的 ,需要知道全部未来时刻的 , 。这是因为积分(5-100)求 是从 逆时间进行的。于是在实现最优控制时,必须预先知道 在 中的变化规律。)(tg)(Z ftt )(tg ft )(tZ , 0 ftt 在某些情况下能做到这点,如

46、跟踪卫星时,卫星的运动可事先计算出来。但大部分情况下 的将来值是未知的,如导弹攻击敌机,敌机的运动规律不知道。这时可有两种处理方法:一种是根据 对 的测量,预报它的将来值,另一种是将 看成随机的。用后一种处理方法时,当然只能得到统计平均意义下的最优。)(tZ )(tZ )(tZ 例5-6 已知一阶系统 其中 , , 。寻找最优控制 使 最小。0p 0q 0r J )(tu性能指标为)()()( tutaxtx )()( txty (5-104) ftf dttrutqetpeJ 0 222 )()(21)(21(5-105) 解pPrRqQCBaA ,1,1,由(5-104)(5-105)知由

47、(5-103)得由(5-99)可得标量函数满足下面的一阶黎卡提方程 )()()(1)( txtKtgrtu (5-106)qtKrtaKtK )(1)(2)( 2(5-107) ptK f )( )()()(1)( tqZtgtKratg )()( ff tpZtg )(1)()(1)( tgrtxtKratx 最优轨线 由(5-95)求得:)()( tytx 标量函数 满足微分方程(5-100),即)(tg 由(5-101)求得边界条件边界条件由(5-102)求得为 图5-5 、 、 以 为参数的时间曲线( )x t ( )u t ( )g t r 图5-5 (a)表示了当 , , , ,和

48、理想输出 时,以 为参数的最优 的一组曲线。1a 0)0( x 0p 1q1ft )(1)( ttZ r )(tx 由图可见,随着 的减小, 跟踪 的能力增强。此外,在接近 时,跟踪误差又回升,这时因为 , ,使 的缘故。)(txr )(tZ1ft0p 0)()( ff tKtg 0)( ftu )(tu 图5-5 (b)表示了最优控制曲线,随着r的减小, 增大,所以提高跟踪能力是以增大控制量为代价的。 图5-5 (c)是 的变化曲线。由图5-5 (a)可见当 ,也就是 的百分之一时,控制量较大才获得较好的跟踪性能。)(tg01.0r q 5.7 设计线性二次型最优控制的若干问题 1)给出系统

49、的数学模型,通常以 、 的形式给出(本章只讨论了 为单位阵的情况)。BUAXX CXY C 2)给定二次型性能指标中的加权阵 、 、 。通常选用常数对角阵。P Q R线性二次型最优控制的设计步骤可大致归结为: 返回子目录 3)解黎卡提方程。对定常系统,终端时间 无穷的稳态问题可解矩阵黎卡提代数方程,其它情况一般要解矩阵黎卡提微分方程,或矩阵黎卡提差分方程。ft 对连续系统得到 或 以后,可求得反馈增益阵 或 。)(tK K)(tG G 对离散系统则是求得反馈增益矩阵 或 ,若 或 阵各元素的值太大,不易在系统中实现,则要更换 、 、 阵,并返回到步骤2),若 或 阵各元素的值合理,则进行步骤4

50、)。)(kL L L G PQ RGL 4)构成闭环系统,求解在典型输入或初始条件下各状态变量的动态响应,若响应不满足要求,则要进一步改变 、 、 阵,并返回步骤2).PQ R 若满足要求,则停止计算。一般来说,把 中某个加权系数增大,则对应的状态变量会收敛得更快些, 中某个加权系数增大则对应的控制量会小些。QR 从上面的设计步骤可看出,这是一个试凑的过程。若 、 阵选择得合理,就可以减少试凑次数。若 、 选择不合理,设计出来的系统是不满意的。Q RQ R 因此所谓“最优”控制只是使 取最小值,并不一定保证系统的特性在实用中“最优”。另外,采用合理的计算方法可以使黎卡提方程的求解快速和精确。下

51、面对这两个问题作一些简单的讨论。J (一)加权阵的选择。 若已知各状态变量和控制变量允许的最大值为 , 和 , , ,则作为初始选择,可令max1x max2x maxnx max1u max2u maxmu maxmax2max1 111 nxxxQ maxmax2max1 111 muuuR 然后,再根据情况进行调整,直至设计结果满意为止。 (二) 对黎卡提矩阵微分方程的求解。 建议采用变步长的四阶龙格库塔法。不推荐用欧拉法,因为它的数值特性不好。龙格库塔法的计算机程序在一般的计算机数学库中都可找到。黎卡提矩阵代数方程的数值求解也不是一件容易的事,它的解法有很多种。这里介绍一种迭代法(称为

52、牛顿方法)。在(5-31)所示的黎卡提代数方程中,加上一项 再减去 可得KBKBR T1 KBKBR T10111 KBKBRKBKBRQKBKBRKAKA TTTT(5-109) 0)()()( 111 KBKBRQKKBBRAKBBRAK TTTT KBKBRKAKBKBRAKKBBRA TTTTTT 111 )()( 因为故(5-109)可写成迭代格式为1111 )()( iTiTiTi KKBBRAKBBRAK )( 1 iTi KBBRKQ (5-110) 上式是关于 的线性方程,当已求得第 步的后,很容易求得下一次迭代值 。一般来说迭代不一定收敛,但已证明,若选择初始估计 使得闭环

53、系统方程 稳定,则迭代将收敛到黎卡提代数方程的唯一正定解。收敛标准可用1iK i iK1iK 0K)( 01 KBBRA T 其中, 表示矩阵 的第 行第j列元素, 是指定的小数。),( jlK K l njl ii jlKjlk, 21 ),(),( (5-111) 本节讨论了线性系统二次型指标的最优控制问题,这时可得到线性的最优反馈控制律,即控制量正比于状态变量,可写成 ,或 。把这种线性二次型问题的最优控制与非线性系统的开环控制结合起来,还可减少开环控制的误差。线性二次型问题的最优控制一般可分状态调节器问题和伺服跟踪问题两大类。)()()( tXtGtu )()()( kXkLku 5.

54、8 小结1、 返回子目录 这时最优控制可写成 满足黎卡提矩阵微分方程(5-14),终端条件 。从 到 逆向积分(5-14)即可求得 ,积分方法建议采用变步长四阶龙格库塔法。对离散系统有类似要求,最优控制)()()()()()()( 1 tXtGtXtKtBtRtU T )(tK PtK f )( ft 0t)(tK 对于终端时刻 有限的连续系统状态调节器问题,要求加权阵 、 为对称半正定, 为对称正定,但并不要求系统完全可控。ftP Q R2、)()1()()()1()()()( 1 kAkKkBkBkKkBkRkU TT )(kK 满足矩阵黎卡提差分方程。 当连续系统是定常的, 为无限时,可

55、得到所谓稳态状态调节器问题。ft3、 这时的附加条件是:系统要可控,至少可稳; 要正定,或 半正定,但 可观测,至少可检, 。QQ ),( 1QA11 QQQ T 满足这些条件后,)()()( 1 tGXtKXBRtU T 为常数阵。K满足黎卡提矩阵代数方程。可用牛顿迭代法求解。离散系统的稳态状态调节器的求解是类似的,由(5-76)、(5-77)得 ,而K满足黎卡提代数方程(5-78)。G )()()( 1 kKAXBKBBRkU TT 设计线性二次型最优控制系统时,关键问题是要选择合理的 、 、 阵,另外,要选择好的数值方法来求解黎卡提方程。P Q R4、5、 , 、 满足微分方程(5-99)、(5-100),终端条件为(5-101)、(5-102)即 , )()()()()()( 1 tgtXtKtBtRtU T )(tK )(tg )()()( ffTf tPZtCtg )(tZ是理想输出。跟踪问题的解法可表示为)()()( ffTf tPCtCtK

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!