非线性系统事件触发自适应动态规划理论与方法研究

来源 :北京科技大学 | 被引量 : 3次 | 上传用户:xll526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最优控制问题广泛存在于实际生产生活中的各个方面。因实际中的控制系统大多是非线性系统,所以,使用经典控制理论来解决这类问题存在局限性。自适应动态规划方法(Adaptive Dynamic Programming,ADP)融合了动态规划、强化学习和人工神经网络的思想,为解决非线性系统的最优控制问题提供了新途径。在自适应动态规划方法的基础上,结合事件触发控制方法,本文对事件触发自适应动态规划方法(Event-Triggered Adaptive Dynami c Programming,ETADP)进行了研究。本文的主要工作如下:(1)针对模型未知非线性系统的最优控制问题,本文提出了一种新的事件触发启发式动态规划算法,提出了事件触发条件组,并证明了系统的稳定性。该算法减少了现有算法对假设条件的依赖。(2)针对仿射非线性系统的最优跟踪控制问题,根据事件触发机制所作用的控制器的不同,本文提出了两种事件触发自适应动态规划最优跟踪控制算法,设计了两种事件触发机制,并证明了控制系统能够准确跟踪期望轨迹。(3)针对涉及多控制器的非零和博弈问题,本文提出了多事件触发自适应动态规划算法,并为每个控制器单独设计了事件触发条件组。该算法在保证系统稳定性的同时,也保证了各个控制器的触发独立性。(4)针对零和博弈问题,本文设计了多事件触发自适应动态规划算法。该算法中,每个控制器的事件都与另一个控制器的控制策略相关。该算法能够使得系统状态稳定,并且能够保证控制器的触发独立性。本文所提出算法的基本结构都是执行-评价结构,通过人工神经网络实现:使用评价网络近似值函数;使用执行网络近似控制策略;对于模型未知的系统,使用模型网络近似系统动态模型。针对每个研究的问题和提出的算法,本文都给出了系统稳定性分析,并用仿真实验验证了算法的有效性。理论研究和仿真实验的结果表明事件触发自适应动态规划方法不但具有自适应动态规划方法的自学习能力,而且能够减少对数据量的需求,节省计算和存储空间,节约通信成本,从而为解决实际生产生活中的最优控制问题提供了理论基础。
其他文献
下岗职工再就业问题是社会各界共同关注的一个热点 ,也是政府的一项重要使命。本文从我省下岗职工的现状和特点出发 ,分析了产生职工下岗的原因以及目前再就业所面临的困境 ,
大学生"考研热"一直是备受关注的问题。2014年考研政策发生了较大变化,本文以上海市松江大学城几所高校为例展开针对考研改革后考研动机及影响因素的调查,数据分析结果表明,
在现今社会中,一个人必须要具备良好的心理素质,只有这样才能面临当今社会中的各种机遇和挑战。而对于舞蹈教学来说,就是一个培养良好的心理素质的方式。舞蹈教师应该自觉地
综述了锂离子电池锑基负极材料———金属锑簿膜、锑基合金、锑基复合氧化物的研究进展,重点介绍了锑基合金材料的不同制备方法,并阐述了锑基负极材料的研究进展与开发前景。
为了能够随时应对可能发生的地震、火灾、水灾、化学灾害、重大交通事故及其他人为灾害,甚至恶性犯罪、恐怖活动、战争等,建立一个统一高效的应急救援指挥体系,是提高民防处
在依法治国的框架下 ,必须依法执政 ,使执政具有合法性。而依法执政的首要前提是有法可依 ,主要是建立健全执政法律制度。中国共产党经过自身建设取得了广大人民的拥护。然而
在不同施肥量和密度组合处理条件下,以青薯6号为试验材料,分别于初花期、盛花期、终花期和成熟期测定了马铃薯叶片的叶绿素含量。结果表明:不同施肥组合对马铃薯叶片叶绿素含
解决配电网存在的各种问题是提升企业效益和企业竞争力,满足城市发展的有效手段。结合西安供电局的实际数据,对城市配电网进行了调查研究,指出了城市配电网存在的主要问题,针
中风阴虚证的兼夹证较乡,辨治较复杂,其治疗的基本方法为育阴,以滋补肝肾为主。根据兼夹证的存在,或镇潜平肝,或温润助阳,或滋阴,或补气,或化痰,成活血,或疏肝。因本证复中率