非线性系统最优控制的自适应动态规划方法及应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：rossifish

【摘要】

：

在控制工程实践中，存在着大量的非线性系统的最优控制问题。自适应动态规划(Adaptive Dynamic Programming，ADP)作为一种近似求解非线性最优控制问题的新方法，融合了神经网络、

【作者】

：

黄玉柱

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2013年期

【关键词】

：

自适应动态规划最优控制 H∞控制神经网络观测器非线性系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在控制工程实践中，存在着大量的非线性系统的最优控制问题。自适应动态规划(Adaptive Dynamic Programming，ADP)作为一种近似求解非线性最优控制问题的新方法，融合了神经网络、动态规划和强化学习的思想，有效的克服了“维数灾”的问题，并且能够获得近似最优的闭环反馈控制律，可用于复杂生产过程系统的优化控制设计。然而，自适应动态规划方法体系还未完善，利用自适应动态规划方法研究非线性系统最优控制的许多理论与技术问题还有待解决。本文基于自适应动态规划方法研究了在模型未知和存在外界干扰情况下的非线性系统的最优控制问题，并将自适应动态规划方法成功的应用于煤化工生产过程控制中，取得了很好的控制效果。本文的主要工作和贡献体现在以下四个方面。　　 1.研究离散时间下模型完全未知的非线性系统，利用贪婪迭代启发式动态规划(HDP)方法，设计神经网络最优控制器，实现了系统的最优跟踪控制。首先通过构造神经网络辨识器来学习未知系统的动态特性，同时建立前馈控制器来产生系统稳态跟踪控制;然后利用系统变换，将最优跟踪控制问题转化为最优误差调节器设计问题，进而引入贪婪迭代HDP算法得到系统的最优反馈控制律，并对迭代算法的收敛性进行证明;最后进行仿真实验，仿真结果表明基于贪婪迭代HDP的神经网络控制器是有效的。　　 2.考虑有外界干扰情况下，针对离散非线性系统，设计基于GHJI(Generalized Hamilton-Jacobi-Isaacs)和神经网络的H∞跟踪控制器，解决了存在外界干扰条件下的非线性系统的跟踪控制问题。首先通过系统变换，将跟踪控制问题转化为误差调节器设计问题;然后建立系统的GHJI方程，设计近似最优迭代算法求解最优控制策略，并对迭代算法的收敛性和控制系统的稳定性进行了证明;最后利用神经网络实现H∞最优跟踪控制器，并通过仿真实验说明该方法是可行且有效的。　　 3.针对连续时间下未知的非线性系统，基于神经网络观测器，利用自适应动态规划方法设计神经网络控制器，解决了连续非线性系统的最优控制问题。首先为了得到系统的状态信息，构造神经网络观测器，并给出观测器稳定性的证明方法;然后利用自适应动态规划方法，建立系统的最优控制器，同时分析了包含神经网络观测器和控制器的整个闭环系统的稳定性，并给出相关证明方法。最后进行仿真实验，仿真结果表明该方法有效的解决了未知的连续非线性系统的最优控制问题。　　 4.研究自适应动态规划方法在煤制甲醇变换单元温度控制中的应用。首先，我们利用机理分析建模方法和神经网络建模方法，分别对系统进行建模;然后，通过设置关键过程参数的评价函数，将机理模型和神经网络模型相结合，进而能够根据不同工况条件来实时调整神经网络模型，使得其更加接近实际系统的动态特性。在建模完成之后，利用双启发式动态规划方法，建立神经网络温度控制器。最后进行仿真实验，仿真结果表明基于双启发式动态规划的温度控制器是可行的，实现了变换炉触媒层温度的最优控制。

其他文献

基于RGB-D融合数据的室内导航方法研究

作为移动机器人的一项核心能力，室内导航始终在机器人领域占有十分重要的地位。随着机器人技术的不断发展，许多成熟的室内导航方法被逐渐地提出并成功的得到了实现。然而由于成

学位

RGB-D融合数据传感器室内导航方法特征提取摄像头标定移动机器人

基于改进最小二乘支持向量机的颗粒粒度软测量研究

本文在介绍了颗粒粒度测量方法及软测量的研究现状的基础上,针对颗粒粒度在线测量存在的一系列的问题,提出了基于改进最小二乘支持向量回归机的软测量方法,本文研究的内容主

学位

粒子群算法量子粒子群算法支持向量回归机混合核函数软测量颗粒粒度

监控视频的可伸缩编码与快速浏览技术研究

近年来，随着国内外安防监控需求的不断增长，面向安防监控的视频高效编码与快速浏览技术受到了工业界和学术界的密切关注。其中面向监控视频灵活存储的可伸缩编码技术和面向监控

学位

监控视频可伸缩编码快速浏览技术视频浓缩增强存储

一类非齐次高阶不确定非线性系统的控制设计

学位

离心式压缩机建模及仿真研究

离心式压缩机能够满足工业上对气体压缩的需求,随着工业发展的继续,其应用范围越来越广泛。然而长期以来,离心式压缩机始终存在着一些不可避免的缺点,如整机的效率不高,稳定工况较窄和随着工况的变化往往会发生喘振等现象。因此,分析和了解压缩机内部能量传递情况,详细探讨并建立用于实际生产的离心式压缩机模型是十分必要的。本文以某大型煤气系统中离心压缩机为研究对象,基于Greitzer压缩机理论模型,结合设备工艺

学位

离心压缩机动力学模型灵敏度分析模型校正

人工人口出行行为的平行标定方法研究

近年来，城市交通问题变得越来越突出。各级政府都在努力寻找缓解拥堵、减少事故的城市交通管控措施。目前较为行之有效的办法是在增加交通供给的同时，采用科学合理的管理措施和

学位

城市居民人口出行行为分析人工交通系统平行标定模块

开放域命名实体抽取关键技术研究

开放域命名实体抽取是近年来信息抽取领域的研究热点，其主要任务是从多源异构数据中抽取并构建开放类别命名实体列表。这一任务涉及自然语言处理、机器学习、模式分类、信息抽

学位

开放域命名实体抽取种子实体质量评估新种子生成置信度计算图随机游走

雾天场景下交通视频检测若干问题的研究

智能交通将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用到整个地面交通管理系统，建立了一种在大范围、全方位、实时、准确、高效

学位

交通视频检测均质雾天天气识别摄像机标定能见度检测

高光谱遥感图像分类算法研究

高光谱图像为地物探测带来新的途径，也给遥感图像处理引入了新的课题。而高光谱图像中的分类问题，一直是高光谱图像研究领域中的一个主要课题。尽管与高光谱图像分类的相关研究

学位

高光谱遥感图像模式识别分类算法

基于空间特征匹配的视觉目标跟踪技术研究

传统的目标跟踪算法通常选取波门内的矩形区域作为跟踪模板，采用相关匹配或迭代算法在后续帧中寻找目标的新位置。其有效性的前提之一是波门内图像区域具有足够的纹理特征能和

学位

局部特征视觉目标跟踪技术单应矩阵计算机图像时间复杂度

非线性系统最优控制的自适应动态规划方法及应用

与本文相关的学术论文