论文部分内容阅读
摘 要 针对带有参数不确定性的非线性倒立摆的跟踪控制问题,提出一种RBF神经网络补偿的PD控制方法。该方法采用RBF神经网络逼近系统不确定非线性函数,结合常规的PD控制方法设计控制器,实现倒立摆的跟踪控制。仿真结果表明,该方法能有效实现倒立摆的快速跟踪,并保证了对不确定参数的不敏感性。
关键词 不确定性;跟踪控制;RBF神经网络
中图分类号:TP273 文献标识码:A 文章编号:1671-7597(2014)01-0040-02
倒立摆本身是一种复杂非线性系统,具有多变量、耦合性强、稳定性差且极不稳定的特点,很多典型的实验研究都基于此展开,跟踪控制就是其中之一。目前已有很多文献使用不同的控制方法针对倒立摆进行跟踪控制的研究,比如使用滑模变结构控制方法、鲁棒控制等。文中使用RBF神经网络对带有参数不确定性的非线性部分进行逼近,结合常规的PD控制方法设计控制器,对非线性的倒立摆进行跟踪控制研究。
1 问题描述
考虑如下一类二阶非线性系统:
(1)
式(1)中,为未知函数部分,为已知函数部分,和分别为系统的输入和输出。式(1)还可以写为:
设位置指令为,令
,
选择,使多项式的所有根部都在复平面左半平面上。
取控制律为
(2)
将(2)代入式(1),得到闭环控制系统的方程:
由于的选取,可得时,,即系统的输出及其导数渐进地收敛于理想输出及其导数。
文中提到的一类非线性系统中,如果是确定的,则可以选择来消除其非线性的属性,再由线性控制理论设计控制器;假如不能确定且系统含有其他不确定性因素,控制律(2)则很难实现;而RBF神经网络具有万能逼近的特性,若采用RBF网络对不确定项进行自适应逼近,即采用神经网络系统代替,可实现自适应神经网络的补偿,同时可以测试控制器对不确定性因素的不敏感性。
2 控制器设计
20世纪80年代末J.Moody和C.Darken提出了径向基函数(RBF-Radial Basis Function)神经网络,它是具有单隐层的三层前馈网络。该网络可以模拟人脑中局部调整、相互覆盖接收域的网络结构,因此该网络也是一种局部逼近网络,目前已经证明它能以任意精度逼近任意连续函数。具体的网络结构如下图所示。
图1 RBF网络结构图
径向基函数网络算法取,,其中,为输入部分,为输入个数,为网络隐含层节点数,为高斯基函数的输出,为神经网络权重,为网络的逼近误差值,;采用径向基函数网络逼近,已知的表达式,取输入,RBF网络的输出为。式(2)可变为:
(3)
(4)
式中,为神经网络高斯基函数,神经网络权值根据自适应律而变化。
设计自适应律为
(5)
3 稳定性分析
参考文献[5]所提出的间接自适应模糊控制方法,对本闭环系统进行稳定性分析如下:
由式(3)代入式(1),可得如下系统的闭环动态方程:
(6)
令,,则动态方程(6)可写为向量形式:
(7)
设最优参数为,式中为的集合。
定义最小逼近误差为
式(7)可以写为
(8)
将(4)式代入(7)式,可得闭环动态方程:
(9)
以上方程中给出了跟踪误差和权值之间的关系。同时,自适应的目标主要是为确定一个调节机制,使跟踪误差和参数误差达到最小。
下面定义Lyapunov函数为
(10)
式中,是正数,为一个正定矩阵且满足Lyapunov方程
(11)
式中,是一个任意的2×2正定矩阵,同前面。
取,,
令,则式(9)变为,则
将代入上式,
并考虑,得
的导数为
将自适应律式(5)代入上式,得
由于≤0,通过选取最小逼近误差非常小的神经网络,可实现≤0。
4 仿真研究
被控对象取单级倒立摆,其动态方程如下
,
式中,
,
,和分别为摆角和摆速,=9.8m/s2,为小车质量,=1kg,为摆杆质量,=0.1kg,为摆杆长度的一半,=0.5m,为控制输入,为摆杆的不确定性因素,取,其取值范围区间。取位置指令,倒立摆的初始状态为,=0.1,=0.5,=2,=5,神经网络权值初始值取0。
采用控制律式(3),自适应律取式(5),取,=50,=30,自适应参数取=30。仿真结果如下。
图2 摆角的位置跟踪
图3 摆速的跟踪状况
1)取上限值时:
图4 RBF网络自适应补偿仿真结果
2)取下限值时:
图5 RBF网络自适应补偿仿真结果
图2至图5给出了倒立摆在存在不确定性因素情况下,摆角、摆速及神经网络跟踪补偿的仿真结果,由图2、3可以看出,倒立摆的摆角及摆速能快速实现位置指令的跟踪,跟踪效果好;根据的上下限值分别进行仿真,由图4和图5可以看出大约1秒中左右时间,RBF能自适应逼近非线性函数,实现非线性部分的有效补偿,且对不确定性因素具有一定的不敏感性,仿真结果也说明了这一点,同时也可以得到,在给定的不确定性干扰值区间之内,所设计的控制器能有效的实现位置指令的跟踪,控制效果良好。
5 结论
针对一类带有不确定性因素的非线性系统的跟踪控制问题,文中以倒立摆为实例进行仿真,结果表明基于RBF神经网络补偿的PD控制方法能实现摆杆的有效跟踪控制,且对不确定性干扰因子具有一定的不敏感性。
参考文献
[1]王洪斌,姚洪磊.基于Backstepping的倒立摆鲁棒跟踪控制[J].计算机仿真,2009,26(4):357-360.
[2]邱德慧,王庆林,周游.基于动平衡状态的不确定倒立摆系统跟踪控制[J].应用基础与工程科学学报,2012,20(2):336-344.
[3]高兴华,耿德旭,高玉峰,马惜平.基于反演滑模变结构控制的倒立摆系统跟踪控制设计[J].北华大学学报,2008,9(6):559-562.
[4]刘金琨.先进PID控制MATLAB仿真(第3版)[M].北京:电子工业出版社,2013.
[5]王立新,王迎军译.模糊系统与模糊控制教程[M].北京:清华大学出版社,2003.
[6]J.Park,I.W.Sandberg. Universal approximation using radial basis function networks, Neural Computation.1990,3:246-257.
作者简介
姜峰(1983-),男,山东聊城人,讲师,硕士,研究方向:智能控制、非线性系统控制。
关键词 不确定性;跟踪控制;RBF神经网络
中图分类号:TP273 文献标识码:A 文章编号:1671-7597(2014)01-0040-02
倒立摆本身是一种复杂非线性系统,具有多变量、耦合性强、稳定性差且极不稳定的特点,很多典型的实验研究都基于此展开,跟踪控制就是其中之一。目前已有很多文献使用不同的控制方法针对倒立摆进行跟踪控制的研究,比如使用滑模变结构控制方法、鲁棒控制等。文中使用RBF神经网络对带有参数不确定性的非线性部分进行逼近,结合常规的PD控制方法设计控制器,对非线性的倒立摆进行跟踪控制研究。
1 问题描述
考虑如下一类二阶非线性系统:
(1)
式(1)中,为未知函数部分,为已知函数部分,和分别为系统的输入和输出。式(1)还可以写为:
设位置指令为,令
,
选择,使多项式的所有根部都在复平面左半平面上。
取控制律为
(2)
将(2)代入式(1),得到闭环控制系统的方程:
由于的选取,可得时,,即系统的输出及其导数渐进地收敛于理想输出及其导数。
文中提到的一类非线性系统中,如果是确定的,则可以选择来消除其非线性的属性,再由线性控制理论设计控制器;假如不能确定且系统含有其他不确定性因素,控制律(2)则很难实现;而RBF神经网络具有万能逼近的特性,若采用RBF网络对不确定项进行自适应逼近,即采用神经网络系统代替,可实现自适应神经网络的补偿,同时可以测试控制器对不确定性因素的不敏感性。
2 控制器设计
20世纪80年代末J.Moody和C.Darken提出了径向基函数(RBF-Radial Basis Function)神经网络,它是具有单隐层的三层前馈网络。该网络可以模拟人脑中局部调整、相互覆盖接收域的网络结构,因此该网络也是一种局部逼近网络,目前已经证明它能以任意精度逼近任意连续函数。具体的网络结构如下图所示。
图1 RBF网络结构图
径向基函数网络算法取,,其中,为输入部分,为输入个数,为网络隐含层节点数,为高斯基函数的输出,为神经网络权重,为网络的逼近误差值,;采用径向基函数网络逼近,已知的表达式,取输入,RBF网络的输出为。式(2)可变为:
(3)
(4)
式中,为神经网络高斯基函数,神经网络权值根据自适应律而变化。
设计自适应律为
(5)
3 稳定性分析
参考文献[5]所提出的间接自适应模糊控制方法,对本闭环系统进行稳定性分析如下:
由式(3)代入式(1),可得如下系统的闭环动态方程:
(6)
令,,则动态方程(6)可写为向量形式:
(7)
设最优参数为,式中为的集合。
定义最小逼近误差为
式(7)可以写为
(8)
将(4)式代入(7)式,可得闭环动态方程:
(9)
以上方程中给出了跟踪误差和权值之间的关系。同时,自适应的目标主要是为确定一个调节机制,使跟踪误差和参数误差达到最小。
下面定义Lyapunov函数为
(10)
式中,是正数,为一个正定矩阵且满足Lyapunov方程
(11)
式中,是一个任意的2×2正定矩阵,同前面。
取,,
令,则式(9)变为,则
将代入上式,
并考虑,得
的导数为
将自适应律式(5)代入上式,得
由于≤0,通过选取最小逼近误差非常小的神经网络,可实现≤0。
4 仿真研究
被控对象取单级倒立摆,其动态方程如下
,
式中,
,
,和分别为摆角和摆速,=9.8m/s2,为小车质量,=1kg,为摆杆质量,=0.1kg,为摆杆长度的一半,=0.5m,为控制输入,为摆杆的不确定性因素,取,其取值范围区间。取位置指令,倒立摆的初始状态为,=0.1,=0.5,=2,=5,神经网络权值初始值取0。
采用控制律式(3),自适应律取式(5),取,=50,=30,自适应参数取=30。仿真结果如下。
图2 摆角的位置跟踪
图3 摆速的跟踪状况
1)取上限值时:
图4 RBF网络自适应补偿仿真结果
2)取下限值时:
图5 RBF网络自适应补偿仿真结果
图2至图5给出了倒立摆在存在不确定性因素情况下,摆角、摆速及神经网络跟踪补偿的仿真结果,由图2、3可以看出,倒立摆的摆角及摆速能快速实现位置指令的跟踪,跟踪效果好;根据的上下限值分别进行仿真,由图4和图5可以看出大约1秒中左右时间,RBF能自适应逼近非线性函数,实现非线性部分的有效补偿,且对不确定性因素具有一定的不敏感性,仿真结果也说明了这一点,同时也可以得到,在给定的不确定性干扰值区间之内,所设计的控制器能有效的实现位置指令的跟踪,控制效果良好。
5 结论
针对一类带有不确定性因素的非线性系统的跟踪控制问题,文中以倒立摆为实例进行仿真,结果表明基于RBF神经网络补偿的PD控制方法能实现摆杆的有效跟踪控制,且对不确定性干扰因子具有一定的不敏感性。
参考文献
[1]王洪斌,姚洪磊.基于Backstepping的倒立摆鲁棒跟踪控制[J].计算机仿真,2009,26(4):357-360.
[2]邱德慧,王庆林,周游.基于动平衡状态的不确定倒立摆系统跟踪控制[J].应用基础与工程科学学报,2012,20(2):336-344.
[3]高兴华,耿德旭,高玉峰,马惜平.基于反演滑模变结构控制的倒立摆系统跟踪控制设计[J].北华大学学报,2008,9(6):559-562.
[4]刘金琨.先进PID控制MATLAB仿真(第3版)[M].北京:电子工业出版社,2013.
[5]王立新,王迎军译.模糊系统与模糊控制教程[M].北京:清华大学出版社,2003.
[6]J.Park,I.W.Sandberg. Universal approximation using radial basis function networks, Neural Computation.1990,3:246-257.
作者简介
姜峰(1983-),男,山东聊城人,讲师,硕士,研究方向:智能控制、非线性系统控制。