基于强化学习的状态不可测离散严格反馈非线性系统事件触发控制

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:oswaldhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代工业控制系统的复杂化、数字化,具有未知非线性动态的离散系统逐渐成为了现代控制领域研究的热点。考虑到许多实际系统可以建模为严格反馈形式,比如无人船、机械臂、无人机,而且在实际场景中往往很难通过传感器获取系统的所有状态,因而本文围绕着一类具有未知非线性动态的状态不可测离散严格反馈非线性系统展开研究。注意到目前网络控制系统的普遍化,网络通信负担增加,如何为上述系统设计一种有效的事件触发机制来降低网络通讯负担,并结合强化学习来优化控制性能是一个前沿且具有挑战的课题。鉴于此,本文的主要工作概述如下:首先,针对具有未知动态的状态不可测离散严格反馈非线性系统,本文通过设计一种神经网络状态观测器来估计系统的状态信息,从而实现对状态量的实时观测和解耦状态观测器和控制器设计。在控制器设计过程中,本文通过采用一种变量代换策略代替传统的预测技术,不仅能够解决控制器设计的因果矛盾问题,而且能够避免控制器的n步时延问题。随后,基于自适应评价机制,设计依赖评价-执行网络的最优控制器,实现对系统输出的镇定控制。其次,考虑状态不可测离散严格反馈非线性网络控制系统,系统的通信网络位于状态观测器到控制器之间。本文采用反步法和变量代换策略进行控制器设计。在评价-执行网络中,为了使方案更符合跟踪控制的特点,本文采用一种巧妙的迭代变换技术将执行网络更新律中的控制误差项刻画为已知的系统内部动态信息,从而得到更加准确可行的更新律,并能够保证执行网络误差的收敛,使控制器达到最优。为了降低通信网络数据传输,本文通过设计一种新型的事件触发条件,在降低网络传输负担的同时能够实现系统输出对参考信号的稳定跟踪。最后,本文重置上述网络控制系统的通信网络位置,考虑传感器到状态观测器之间的通信网络。此时在网络中只需传输系统输出信息,可以进一步降低网络传输负担;并据此设计一种基于动态事件触发机制的状态观测器,保证事件触发通信网络下的状态观测效果。随后,结合反步法、变量代换策略等技术,设计基于评价-执行网络的最优控制器,确保闭环系统稳定以及系统的跟踪控制性能。
其他文献
迭代学习控制是一种无监督、数据驱动的控制策略,其主要思想是根据以往迭代试验中实测数据不断更新控制输入信号,逐步提升系统跟踪性能,最终实现系统输出沿迭代域收敛于给定期望轨迹。本文重点研究了几类分布参数系统的迭代变期望轨迹跟踪控制问题,参照期望轨迹的已知变化规律进行学习控制算法设计,进一步丰富了该系统非严格重复性迭代学习控制领域的研究成果。论文的主要工作可总结为以下三个部分。1.考虑了一类双曲型分布参
学位
随着互联网信息技术在医疗领域的广泛应用,医疗数据不仅增长迅速,而且还有着来源广泛、结构复杂、种类繁多的特点,大量的医疗数据中蕴藏着丰富有价值的信息,如何有效挖掘医疗数据中的隐藏价值成为了一个研究热点。目前各类医疗信息之间缺乏直观的关联性以及形象的呈现方式,给医生的诊断和治疗方案决策造成不便。相比文本或表格的信息呈现方式,数据可视化技术能够融合计算机的精确计算能力和人的抽象认知能力,将数据以图形化的
学位
<正>2023年6月17日,第二届数字时代教师专业发展学术圆桌暨《中国教师培训发展报告(2022)——精准培训视角》发布会在国家开放大学出版传媒集团举行。多家单位和媒体的代表现场参会,在线观看直播人数超过14500人。会议发布了《中国教师培训发展报告(2022)——精准培训视角》。报告深度聚焦我国教师精准培训改革,依托教育部教师工作司提供的基础数据和国培项目案例,基于全国范围15万人调研样本、29
期刊
清香型白酒以其清雅纯正而得名,随着近年来山西汾酒的高速发展,清香白酒市场逐渐提升。在清香型白酒酿造过程中,大曲为糖化发酵剂和生香剂,酒醅为白酒发酵微生物的生长提供能源物质。本研究通过测定大曲和大茬发酵酒醅理化指标和大茬酒醅中特征香气成分的相对含量,并采用高通量测序技术对清香型白酒大曲和大茬发酵酒醅中微生物结构及动态变化进行分析研究,揭示大茬酒醅理化指标、风味物质和微生物群落结构之间的相关性,深入了
学位
随着我国社会经济发展与城市化进程的加快,人们的生活方式发生巨大变化,心血管疾病的患病率也随之逐年攀升。为减轻社会医疗负担,近年来医疗领域的信息化与智能化飞速发展,积累了大量临床电子病历数据。本文旨在从非结构化或半结构化的心血管电子病历文本中,解析节点信息,抽取医学实体与三元组知识,并对临床诊断原词进行标准化,实现心血管疾病的医学知识积累,为医学知识图谱的构建打下基础,为病历查阅与医学数据统计分析提
学位
鳞杯伞(Clitocybe squamulosa)营养均衡,含有丰富的食用和药用价值,拥有十分广泛的研究和开发潜力。本研究主要通过采用超声波辅助碱提法对鳞杯伞蛋白进行提取,探索反复冻融处理对鳞杯伞蛋白结构、加工特性、消化特性及抗氧化活性的影响,为鳞杯伞蛋白的加工和利用提供一定的理论基础,试验结果如下:(1)伴随冻融次数的增加,游离巯基含量和表面疏水性呈先增高后降低的趋势,且均在第三次冻融处理时达到
学位
【目的】香菇的独特风味是由其风味物质所决定的,不同的处理方式会对香菇的风味物质产生影响,进而影响香菇的风味。目前,研究较多的是干燥和蒸煮对香菇风味物质的影响,而酶解处理对香菇风味物质影响的研究还比较少见。因此,研究纤维素酶、风味蛋白酶及两种酶复合酶解对香菇风味物质的影响,并以此为基础,研制一款新型香菇调味酱,为食用菌风味物质的释放及其调味品的研制提供理论依据。【方法】(1)酶解对香菇风味物质的影响
学位
近年来,机械臂凭借高精度、高重复性等特点,已经在高端制造、社会服务、航空航天等领域得到了广泛运用。然而,由于固有的高度非线性特性以及不确定建模等因素,传统的机械臂轨迹跟踪控制往往难以达到令人满意的控制性能。另一方面,伴随着生产生活的需要,机械臂的作业任务逐渐深入到与环境、人交互协作中,传统的位置控制也已不适应机械臂频繁的物理交互,因此,针对带有不确定性的机械臂,如何设计与环境交互的机械臂高性能柔顺
学位
谷物作物已经成为全世界最重要的农作物之一,为进一步增加谷物产量,在种植过程中常施用大量农药。由于有机磷农药的广泛使用和监管不力,很可能会导致其在谷物中形成残留,当其浓度超过最大残留限量时,会对人体健康造成很大负面影响。因此,急需开发一些快速、便捷、灵敏、绿色的检测谷物中有机磷类农药残留的方法。本研究将绿色的低共熔溶剂与光谱技术相结合,建立了两种适用于谷物样品中有机磷类农药残留的提取和检测方法,具体
学位
本文以燕麦为原料,对燕麦乳的加工工艺和稳定性进行研究。通过分析与燕麦乳稳定性相关的指标,优化酶解、胶磨和均质过程中的最佳条件;并对不同杀菌温度条件下燕麦乳中的燕麦蛋白的聚集特性进行分析;最终确定最佳的稳定剂的种类和添加量。试验结果表明:燕麦在酶解、胶磨和均质加工工艺过程中均会使燕麦乳的相对粘度减小,可溶性固形物和可溶性蛋白含量增大,离心沉淀率减小,浊度减小,平均粒径减小,Zeta电位值减小。最终确
学位