基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:qwezxcasdqwezxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了
其他文献
目的观察自我管理对肺癌化疗患者心理状态、自我护理能力、生活质量的影响。方法选择2015年6月-2018年3月就诊于本院的110例肺癌化疗患者为研究对象,随机分为对照组和观察组
目的探讨中医针灸推拿护理在颈椎病患者的护理中的临床效果。方法选取2017年6月—2018年6月于本院治疗的100例颈椎病患者作为研究对象,按照随机数字表法分为研究组和对照组两
目的研究持续质量改进在降低急诊静脉输液穿刺失败率的应用效果。方法选取2016年1月—2018年1月本院急诊静脉输液的460例患者作为研究对象,其中,2016年1月—2017年1月收治的
5月21日,东辽联社白泉信用社喜迁新址并举行了热烈而又节俭的开业仪式.开业当天,前来办理业务的新老客户人头攒动,络绎不绝.白泉信用社的迁址开业再次提升了东辽联社整体服务
创新创业教育成为当下绝大多数高校素质教育的趋势,而实践类课程改革是实施创新创业教育的重要内容。金工实习是多数高校在工科专业中所开设的一门必修课程,旨在培养学生对机械
现代刑事诉讼制度发展的一个突出特点,就是在赋予诉讼当事人尤其是刑事被告人以充分的诉讼权利的基础上,以独立的私权对抗强大的公权体系,表现出对民主、科学、人权的理想诉讼模
目的探讨案例教学法(case-based learning,CBL)在医学留学生临床药理学课程教学中的应用效果。方法选取2017年3月—6月授课的安徽医科大学国际教育学院2013级医学留学生两个班
为了解决现有植酸盐转化膜耐水洗性差的问题,利用植酸的反应活性及酸催化活性,使之与三乙醇胺进行酯化反应,将所得产物与促进剂、配位剂等进行复配,采用正交法优化转化液配比和转
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着社会对同时掌握商务与英语的商务英语专业学生的需求的加大,高校对商务英语专业的人才培养更加重视。为了更好地加强学生在商务领域运用英语的能力,产学研用合作对高校商