基于强化学习技术的H∞跟踪控制研究

来源 :辽宁石油化工大学 | 被引量 : 0次 | 上传用户:jenny18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能,作为21世纪三大尖端技术之一,正在以它巨大的影响力改变着世界。它所涉及的学科十分广泛,极富挑战性。机器学习是促动人工智能不断发展的强大动力,而强化学习作为机器学习中的一种热门的算法,也被广泛的应用在各行各业之中。利用强化学习技术解决优化控制问题引起了众多学者的注意,本文基于此课题,进行了深入的研究。由于实际应用中,被控系统的状态很难直接的测量,且测量的成本很高。因此,模型参数未知的系统利用状态数据学习最优控制器将面临挑战性难题。我们提出了一种利用强化学习Q-Learning算法来解决线性离散系统的跟踪控制问题。同时根据是否在系统中考虑干扰项的情况,提出两种算法。并通过实验进行了仿真验证,结果表明,在系统考虑干扰项的情况下,具有更好的跟踪效果。基于此,本文的主要研究工作包括:1.针对离散时间未知线性系统,提出非策略Q-学习算法,来求解线性二次跟踪控制(LQT)控制问题。为了解决此问题,本文采用构建增广的非最小状态空间方程模型转化的方法,提出一种非策略Q-学习方法,不要求系统模型参数已知,不利用系统状态数据,无需设计状态观测器,仅利用输入输出增量数据,使系统稳定地跟踪参考信号。2.在系统中考虑干扰项,并且对所提出的算法,进行了优化,将普通的最优跟踪控制问题,转化为H∞的跟踪控制问题。与一般的跟踪控制问题相比,H∞的跟踪控制问题具有更好的抗干扰性,这一点在仿真实验中进行了验证。鉴于具有抗干扰性以及更好的跟踪效果,此算法针对SC-1乙烯裂解炉的出口温度这一实际例子进行了仿真,结果表明,利用本算法,可以很好的跟踪乙烯裂解炉的出口温度,表明本算法具有一定的实际意义。3.本文的贡献在于考虑实际系统模型参数未知以及状态不可测的情况给状态反馈控制实现带来的挑战性难题,避免系统模型参数未知给状态观测器设计和输出反馈控制器设计带来的计算复杂性,通过非最小状态空间模型转化,基于可测的系统输出数据和控制输入,实时在线学习抗干扰跟踪控制策略,实现系统稳定跟踪参考目标并且具有一定的抗干扰能力。
其他文献
近年来我国呈现大发展的趋势,主要盾构技术领域取得关键性进展,地下空间的施工可以依靠盾构技术实现。与此同时,城市管道系统的立体化建设也要依靠盾构技术。盾构施工是挖地下隧道的主要手段,施工手段对环境影响很小,施工的具体方案也不受相关地貌的影响,在相关领域进行研究时是隧道施工的主要解决方案。土压平衡盾构维持土压平衡仓维持挖堀面的平衡并且向前正常推进,如果控制的方式方法不当,会影响地质面貌和土地安全,也会
学位
根据十九大报告中的质量强国要求,高技术产业迎来了新的发展契机,我国开始投入大量精力用于技术创新。从2019年的全球竞争力排名来看,我国仅在全球竞争力中排名28位,由此可见我国同发达国家相比,仍处于落后水平。因此,我国不能停止对高技术产业的研究与发展。本文基于2015-2019年高技术产业数据,从技术投入、产出、支撑三方面构建高技术产业技术创新能力指标体系,并利用熵值法计算得到技术创新能力得分,以此
学位
近些年来,我国在科技创新领域取得了出色的成绩。在日趋城市化的大背景下,地面上可开发的空间越来越少,所以对地下空间的开发利用成了当务之急。盾构机作为隧道挖掘的攻坚利器,被广泛应用在隧道工程建设领域,在资源开采、隧道挖掘以及市政建设等地下工程中扮演着十分重要的角色,这离不开其独特的功能及众多的优点,例如:完美适应地形、工作效率强、自动化程度高、安全环保、影响小等。盾构机密封舱土压平衡一直是研究的重点问
学位
循环流化床锅炉是一项新型的清洁燃烧技术,它不仅具有燃烧效率高和燃料适应性广的优点,而且污染物排放量低,在热电生产中得到越来越广泛的应用,是我国工业锅炉重要的组成部分之一。由于循环流化床锅炉燃烧系统具有大滞后、非线性、时变问题,常规的控制方案效果欠佳,控制系统自动化水平低的现象较为普遍。本文分析循环流化床锅炉燃烧系统的特点及各控制变量之间的关联,将复杂的综合燃烧模型进行简化,建立一个以一次风量、二次
学位
报纸
随着社会主义市场经济的高质量发展,科技创新已成为促进社会经济发展的关键动力,它与国家发展、民众生存密不可分。科技创新也是国家综合国力的重要竞争因素,科技创新的增强,将有助于提高国家国际竞争力、促进经济社会进步、优化产业结构等。明确科技创新发展水平,准确定位科技创新影响因素,在推动区域可持续发展中具有重要作用。由于我国科技创新发展不平衡,定位科技创新影响因素、缩小差距是亟待解决的问题,本文研究主要内
学位
随着“碳中和”政策的颁布,在未来的很长一段时间内,生态环境建设以及减少碳排放量都将成为全社会的重要任务之一。而我国各地区存在社会经济发展不平衡,其“碳中和”水平和生态环境质量也存在显著差异。因此,通过区域生态环境质量的综合评价,有助于了解各地区生态环境质量现状和问题以及各地区的“碳中和”目标差距。本文根据“碳中和”战略下的实践需要,基于DPSIR概念模型构建了生态环境质量评估的指标体系,以我国30
学位
金属支撑型固体氧化物燃料电池极具应用前景,但缺少高性价比制备技术。采用高效率、低成本大气等离子喷涂(APS)在金属基体上制备了氧化钇稳定氧化锆(YSZ)电解质,研究加热基体条件下沉积粒子形貌与涂层结构间的联系,并评估电解质的力学性能和电池性能。结果表明:加热后的基体上,YSZ沉积粒子铺展充分,片层内存在微裂纹,导致结构中除未结合区域外还存在垂直裂纹,涂层孔隙率为7.16%,YSZ纳米压痕硬度和弹性
期刊
红外成像是一种新兴的且应用前景广的技术,它是根据物体会辐射红外线然后利用成像设备计算物体与背景之间的温度差值来形成红外图像,在工业生产、军事领域、医学研究等方向具有广泛应用。相比较传统的可见光反射成像,其优势在于对夜间等环境可见光强度不足的情况下,也具有良好的成像效果。随着经济与城市道路的发展,私家车数量剧增,在夜间行车,因光线不足而导致事故频发,红外技术能够有效地解决此问题,近年来车载红外设备应
学位
随着互联网计算机技术以及人工智能的发展,以输入密码、刷卡或人工登记为主的安防措施已经不再适应新兴技术带来的安防挑战,身份或密码的盗用事件屡屡发生,为应对这种情况各大平台开始研究基于新兴技术的安防手段,其中生物识别因其易采集和辨识度高的特点逐渐成为了安防领域的研究热门。人脸识别在视频监控、目标跟踪等安防领域有着广泛的应用前景,但是传统的人脸识别技术的研究通常是基于PC端进行的,并且因其功耗大、成本高
学位