基于Q学习的有限时间随机线性二次最优控制

来源 :沈阳师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:qq184343882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对系统状态和控制均依赖于噪声的随机线性离散时间系统,采用基于值迭代的Q学习迭代算法求解模型参数部分未知的有限时间随机线性二次(SLQ)最优控制问题。首先给出SLQ最优控制问题可达性条件和适应性条件,并通过矩阵拉格朗日乘子算法得到最优控制增益矩阵序列以及相应的随机代数Riccati方程(SARE)。其次,以值迭代算法为基础定义Q函数,利用Q学习迭代算法获得每个最优控制增益矩阵所对应的迭代控制增益矩阵序列和H矩阵序列。该算法依赖于系统状态信息,摆脱了系统模型参数部分未知的限制,并证明控制增益矩阵序列收敛到各
其他文献
介绍了一种表面式冷却器的电算化热工计算方法,并编制了VB程序,以便于表冷器的设计计算.
农业机械是农业生产力中最具活力的要素.是衡量农业发展.反映农业现代化进程的重要标志。如今乡村农业机械在不断增加.而乡村机耕道不仅未增.连上世纪70年代修建的机耕道因年久失
目的研究六君子汤加减治疗慢性阻塞性肺疾病(COPD)稳定期气虚痰浊型的随机对照试验情况。方法选择2015年3月—2016年4月于我院就医的COPD稳定期气虚痰浊型病患60例,所有病患均
国家的发展离不开电力系统的电力供应,随着我国社会水平的不断进步,国有电力企业也在不断发展,焕发出新的活力。由于国有企业是我国的经济命脉,其盈亏程度极大的影响着我国的
锅炉是发电厂正常运行的必备装备之一,而随着发电厂规模的不断扩大,锅炉设备的应用也是越来越广泛,而这也促使有必要对其安全应用方面加以关注。在这种背景下,文章从火电厂锅炉运
每年都有一定数量的上消化道出血病人转入外科治疗,其中有些病人开腹即可查出明确的原因或出血部位,有的则不易判断,我们遇到过七次剖腹而未确诊者,为此,我们采用了两分法与
通过响应面法对糙米多酚的超声酶解提取工艺进行优化,并采用HPLC(高效液相色谱法)测定10种酚酸化合物的含量,比较5种糙米的总酚含量和酚酸组成的差异性。结果显示,其最佳工艺
传统的医学图像分割中特征提取算法的设计复杂性与应用局限性、稳定性以及特定的特征提取算法与特定的分类器结合的多样性制约着医学图像分割技术的发展,而深度学习是机器学习领域中使用多重非线性变换对数据进行多层抽象的热门算法,其多被应用于医学图像的分类和识别中。在肺组织分割中,针对肺部组织纹理复杂,且胸部CT图像数据的随机噪声大,采用相对成熟的传统分割算法对CT图像进行预处理,再结合深度学习的理论,设计一个
通过对职业教育集团化办学实训基地建设中存在问题的研究,探索运用云技术改进集团化办学实训基地资源共享的管理,促进实训基地资源的整合和共享。
患儿,男,8岁。因性格改变1年余,头痛两个半月,于1994年5月9日入院。入院前一年多无明显诱因出现一次抽搐、发热,未引起家长重视,以后性格由活泼变为安静、不合群,学习成绩下