基于ADP算法的随机离散线性二次最优控制问题的研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:w15002554773
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的快速发展,工业生产过程变得异常复杂.受不确定性、强非线性和多变量等因素的影响,很难用精确的数学模型描述系统的动态特性,从而对研究最优控制问题造成了极大的困难.因此,未知系统下的最优控制问题成为研究热点.本文提出基于神经网络的自适应动态规划(Adaptive/Approximate Dynamic Programming,ADP)算法研究未知随机离散系统在无限时域的线性二次型(Linear Quadratic,LQ)最优控制问题.具体研究内容如下:一、研究了未知平均场随机离散系统下在无限时域的LQ最优控制问题.首先,将黎卡提(Riccati)方程推广到广义的Riccati方程组,状态反馈增益矩阵扩展为增益矩阵对,给出了平均场系统的LQ最优控制存在的充分条件.然后,将随机系统转化为确定性系统,提出一种值迭代的ADP算法并进行了收敛性分析.同时,用反向传播(Back Propagation,BP)神经网络设计模型网络、评价网络和执行网络来分别估计未知的系统模型、目标函数、控制增益矩阵对.最后,通过系统仿真验证了ADP方法的有效性.二、解决了未知的斯坦克尔伯格博弈随机离散系统下的无限时间LQ最优策略问题.首先,把随机系统转化为确定性系统,给出最优策略的存在的充分条件.然后,在满足纳什均衡的条件下,提出ADP算法,构造迭代方程,构造迭代方程时要考虑决策者和跟随者的相互作用,迭代方程的结构特点要求和目标函数的结构特点保持一致,并且迭代方程的个数与决策者和跟随者的个数密切相关,并进行收敛性分析.同时,用BP神经网络设计启发式动态规划(Heuristic Dynamic Programming,HDP)控制器并且通过训练模型网络、评价网络、执行网络分别估计动态系统状态、目标函数、最优策略集.最后,通过仿真实验验证算法的有效性.
其他文献
当前我国大数据技术和人工智能技术飞速发展,正在掀起新一轮的产业技术变革。而在个人信息保护体系中占据重要地位的权利——被遗忘权,尚未在我国获得法律承认。本文通过分析被遗忘权的含义、对比欧盟和美国在被遗忘权立法基础和立法模式方面的不同,重点分析了被遗忘权的适用范围、法律关系和法律责任等内容,对现有被遗忘权制度研究状况进行了梳理。第二章重点分析了被遗忘权制度在人工智能技术条件下面临的新挑战,主要包括智能
“是”字句是汉语中的一个特殊句式,在汉语语法中占有重要地位,看似简单,其实复杂,也是汉语学习者刚开始就会接触到的句式。由于汉语是缺少形态变化的语言,在语法结构和语义结构上存在复杂的关系。因此随着汉语学习者学习的不断深入,会对“是”字句产生一定的困惑。通过设计测试卷的方式对布隆迪大学孔子学院初级汉语学习者进行“是”字句习得的偏误分析,发现布隆迪大学孔子学院初级汉语学习者“是”字句的习得有遗漏、误加、
随着我国国民经济的快速增长及国内多层次的资本市场的构成,这对提高证券公司的竞争实力有了更高的要求和更严峻的挑战。特别是如何对证券公司的效率进行评价是其拓展市场所面对的根本问题。基于此背景,本文通过数据包络分析(DEA)方法和其他几类统计方法相结合对我国证券公司的效率问题进行评价与探究,并通过实例验证取得了较好的效果。首先,选取我国15家证券公司为研究样本,以样本公司在2016年的投入产出指标数据为
随着互联网业务的飞速增长,通信带宽资源紧缺的问题日益严重。光正交频分复用(Optical Orthogonal Frequency Division Multiplexing,OOFDM)技术结合正交幅度调制(Quadrature Amplitude Modulation,QAM)因为拥有极高的频谱效率而受到了广泛的关注。然而在高阶QAM调制下,系统光接收机的灵敏度会急剧下降,使用精准的信道估计与
青少年偏差行为问题日益成为一个突出的社会问题,也已成为一个全球性的社会问题,引起了社会越来越多的关注。初中生作为青少年代群中的一个起始群体,他们的健康成长关系到社
云作为气候变化的重要因素,能改变太阳辐射的能量传输过程,进而影响着地表-大气之间的辐射收支,在辐射能量平衡中扮演重要的角色。此外,目前卫星遥感技术成为地球监测的重要手段之一,然而云的存在会使遥感影像变得模糊甚至阻挡了地物信息,使地物信息无法正确表达,大气、地表参数无法准确反演。因此,云检测成为遥感影像处理的必要环节,对提高遥感数据的利用率有重要意义。传统阈值法使用统一的经验阈值实现图像上所有像元的
高光谱图像中蕴含丰富的空间和光谱信息,在目标检测领域具有巨大的优势,这激发了高光谱图像目标检测技术研究和快速发展,采用高光谱图像进行目标检测的优势有:数据的波段数目较多,光谱特征更加丰富详细,检测、识别的能力较高,而且可以区分地物间的细微差异;可以有效提取各地物的辐射特性参量,极大地增加了对目标地物定量分析的成功率。但是也存在光谱不确定、信息冗余增加等问题。本文主要针对高光谱图像目标检测中的相关问
产品质量和成本是决胜市场的核心因素。在实现产品质量性能的前提下,优化其成本,才能实现产品技术经济效益最大化。因此,本论文基于提升产品质量和成本优化思想,以机械产品设计中公差设计为主线,对并行公差优化和工艺路线决策展开了研究。论文首先分析了零件公差精度对产品性能的影响,从技术上阐述了公差与成本之间的关系,突出了公差设计的重要性。从并行公差设计的技术理论入手,对尺寸链、成本—公差函数以及质量损失做了研
城市植物多样性,尤其是乔木多样性,对城市生态系统服务的提供和城市人口居住环境的改善具有重要作用。居住区绿地植物是城市植物的主要组成部分,与居民联系最为紧密、影响最大。国外的学者在多个城市开展了这一重要功能单元中绿地的研究,但研究主要关注单个城市;在我国,同类研究很少,缺乏对城市居住区内植物多样性的构成特征及其社会经济影响因子的认识。而国内外关于不同城市之间的对比研究,更是罕见。基于此,本研究选择昆
罗耳阿太菌胞外多糖(AEPS)是以玉米黄浆为氮源、玉米淀粉为碳源培养的罗耳阿太菌经过分离纯化所得到的一种胞外多糖。经初步研究其对多种重金属具有很好的螯合效果,并且与化学螯合药物相比更具有安全性。为研发一种安全可靠的排铅制剂,本论文中利用发酵生产的AEPS作为吸附剂,研究其对铅离子的螯合能力及对小鼠的促排铅作用如下:1根据单因素试验的测定结果设计AEPS与铅离子螯合的正交试验,正交试验表明影响吸附的