连续时间线性随机Markovian跳变系统的在线自适应优化控制算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：nankaizhizhuan

【摘要】

：

本文研究了一类连续时间线性随机Markovian跳变系统的在线自适应优化控制器设计算法。并提出了一种新的在线解耦技术,即“子系统转换”,用于分离Markovian跳变系统中子系统之

【作者】

：

宋军

【机构】

：

安徽大学

【出处】

：

安徽大学

【发表日期】

：

2014年期

【关键词】

：

Markovian跳变系统强化学习近似动态规划子系统转换最小二乘法在线

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文研究了一类连续时间线性随机Markovian跳变系统的在线自适应优化控制器设计算法。并提出了一种新的在线解耦技术,即“子系统转换”,用于分离Markovian跳变系统中子系统之间的耦合关系,进而将这种耦合关系表示为一个显性的迭代数学表达式。基于积分强化学习的方法(即,近似动态规划的手段),本文提出了两种新的策略迭代算法用于求解连续时间线性随机Markovian跳变系统的H2/H∞优化控制器设计问题。需要指出的是,这两种新的策略迭代算法是基于“两步迭代”的结构,即“策略评判”和“策略改进”。本文所给出的在线策略迭代算法的最大优势在于,求解对应优化控制器时,仅需要利用系统的部分动态信息,而不需要系统的完整动态信息。而且,与现有的离线计算迭代算法相比,本文中所给出的新的在线策略迭代算法具有更快的收敛速度。本文的主要工作和贡献具体体现在如下五个方面：1.相比较于一般的连续时间线性或者非线性系统,连续时间线性随机Markovian跳变系统有两个组成部分,即跳变的“模态”和连续的“状态”,其中,跳变的“模态”取决于有限状态Markov链,而连续的“状态”则由一个微分方程所决定。连续时间线性随机Markovian跳变系统的变量不仅与连续时间域有关,还依赖于所定义的概率空间。所以,已有的针对连续时间线性或者非线性系统的“近似动态规划”方法,就不可能完全适用。考虑到系统动态信息不完全获知的前提下,求解得到其最优控制器,本文提出了一种新的解耦技术,即“子系统转换”。借助于“并行算法”,利用“子系统”转换技术,将Markovian跳变系统之间的耦合关系被表示为一个显性的等式迭代关系,即“耦合关系改进”。在建立在线自适应优化控制器设计算法的过程中,这个显性的迭代等式起到了非常重要的作用。相关的内容见第二章和第四章。2.在第二章中,研究了连续时间线性随机Markovian跳变系统的在线自适应H2优化控制器的设计算法问题。通过子系统解耦技术,本章节将Markovian跳变系统分离为N个具有耦合关系的子系统。在已知部分动态信息的前提下,应用所给出的在线策略迭代算法求解连续时间耦合代数Riccati方程,并获得最终的依赖于模态的控制器增益序列。本章节不仅证明了算法的收敛性,并通过仿真示例用来验证这个策略迭代算法的有效性和可行性。3.在第三章中,给出了两个计算迭代算法用来求解耦合的对策代数Riccati方程,并求解出连续时间线性随机Markovian跳变系统的H∞控制器。这两个数值迭代算法都是基于Kleinman迭代的框架提出的。首先,本章节给出了“直接并行Kleinman迭代算法”,并证明了其收敛性。随后,通过引入了一个更广义的数值迭代算法,即“广义并行Kleinman迭代算法”,研究了其四种不同情况的迭代算法。最后,数值示例验证了这两个数值迭代算法的有效性。4.在第四章中,提出了一种新的在线策略迭代算法,用于求解连续时间线性随机Markovian跳变系统的H∞优化控制问题。基于第三章的“直接并行Kleinman迭代算法”,并结合“子系统转换”手段,将随机Markovian跳变系统转换为一组拥有相同扰动输入的线性子系统。借助于近似动态规划方法,本章节研究了两执行器零和对策问题,并求解出连续时间耦合对策代数Riccati方程。本章节不仅证明了新的策略迭代算法的收敛性,并通过仿真示例用来验证这个策略迭代算法的有效性和可行性。5.在第五章中,给出了概括总结和前景展望,并指出了研究中有待进一步解决和完善的问题。

其他文献

WS协议序列分析及其在WSN的应用

MAC(Media Access Control)协议决定信道接入方式,为网络内密集分布的节点建立互相通信的数据链路,将有限的无线信道资源分配给网络中的传感器节点。MAC协议的服务质量的高低

学位

WSNMAC协议协议序列节点能耗数据冲突RSSI

基于SOS方法的非线性不确定时滞系统的控制研究

非线性系统普遍存在,不确定性是无法避免的,而时滞又是一般系统所具有。本文以非线性不确定时滞系统为研究对象,借助多项式平方和(Sum of Squares,SOS)理论,直接使用非线性的

学位

非线性不确定时滞系统保性能控制静态输出反馈非脆弱控制容错控制多项式平方和

半桥LLC谐振式AC/DC变换器设计

在新型功率半导体器件的推动下,开关电源技术取得了突破性的进展,正因如此,其应用的场合也愈加广泛,人们对开关电源的要求也越来越严格,电源设备正朝着高效率、轻量化的方向发展。电源的轻量化要通过提高开关频率来实现,开关频率的提高会造成效率的下降,现有的电源设备也存在功率因数低污染电网的问题,所以优质的AC/DC变换技术成为一个新的研究热点。为了实现绿色用电和高效用电,本文提出两级AC/DC变换结构,前级

学位

直流-交流变换器结构设计功率因数校正相比性能

基于最小方差基准的控制系统性能评价

随着工业自动化水平的提高,如何利用实际运行的数据对系统的性能进行评价成为人们日益关心的问题。Harris最早提出利用最小方差基准来评价单输入单输出(SISO)系统的性能。对

学位

最小方差基准非平稳信号FCOR算法性能评价

船舶航向控制系统规范化交互式设计平台

船舶运动控制问题是控制领域的研究热点,从事该项研究的专家学者日趋增多。但是由于船舶运动模型的复杂性,研究人员不得不花费大量时间在船舶建模、仿真等重复性工作上。这严

学位

船舶航向控制仿真平台交互式设计可视化显示

SWCC-OBS网络中关于路由选择优化问题的研究

光突发交换技术因其具有高带宽利用率、传输效率高、应用范围宽、构建设计简便等优点,成为当今光交换领域最有价值的技术之一。目前关于光突发交换网络方面的研究大部分都是

学位

SWCC-OBS网络路由选择分解协调思想虚拟博弈优化

基于直推学习的蛋白质亚细胞定位预测

亚细胞定位是蛋白质组学的重要研究内容,与其功能、代谢等生物过程密切相关,对药物发现、疾病诊断等方面的研究具有重要作用。基于机器学习的计算方法是一种高效的亚细胞定位

学位

蛋白质亚细胞定位预测直推学习机器学习单定位点蛋白质多定位点蛋白质

电液制动实验台信号采集系统

电控液压制动系统是在传统的汽车制动系统的基础上发展而来的,具有结构紧凑、反应迅速等优点,已经逐渐成为制动领域的主要发展趋势。而电控液压制动试验台则是测试电控液压制动系统性能好坏的重要平台,因此在试验台环境下对制动过程中进行数据的采集并分析是测试的重要过程,这一过程将会发现制动过程中系统的缺陷,并及时改正。针对试验台的信号采集要求,本文进行了相关的研究,设计了一款电控液压信号采集系统,首先介绍了整体

学位

电控液压制动传感器信号采集PIC单片机上位机

基于框图模型的自动生成并行代码的研究

计算机及嵌入式系统的多核发展促进了并行计算在软件领域的发展,因此怎样充分利用计算机或嵌入式系统的多核资源使计算任务更快的完成成为一个研究热点。框图模型仿真具有搭

学位

依赖关系框图模型并行程序编译制导指令自动生成

Web服务器上比例延迟保证的分散自校正控制方法

摘要：在服务器端实现比例延迟保证可以显著提高整体网络服务质量(QoS)。Apache是世界使用第一的开源Web服务器软件,可以运行在大多数计算机操作系统上。通过修改源代码,Apache

学位

分散控制自校正控制Apache Web服务器比例延迟保证在线辨识

连续时间线性随机Markovian跳变系统的在线自适应优化控制算法研究

其他学术论文