基于逆向强化学习的舰载机甲板调度优化方案生成方法

来源 :国防科技大学学报 | 被引量 : 0次 | 上传用户:tbtbtb5518232
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示作为学习对象,通过分析舰载机的甲板活动,建立舰载机甲板调度的马尔可夫决策模型(MDP)框架;经线性近似,采用逆向学习方法计算得到回报函数,从而能够通过强化学习方法得到智能优化策略,生成舰载机甲板调度方案。经仿真实验验证,本文所提方法能够较好地学习专家演示,结果符合调度方案优化需求,为形成辅助决策提供了基础。
其他文献
目的探讨类风湿关节炎患者康复训练及健康指导对疾病康复的作用。方法将120例类风湿关节炎患者随机分为实验组和对照组,均进行常规抗风湿治疗和健康教育,实验组在此基础上给
针对在大空间场所下,普通火灾探测技术无法及时发现火灾,常用的闭式喷水灭火系统不能有效发挥作用,结合某PDP(等离子显示器)大空间洁净厂房探讨了大空间场所火灾早期预报与自
长久以来国有企业改革备受关注,积极推进混合所有制经济发展,也成为了经济新常态下坚持公有制为主体,保障国有经济活力、控制力、影响力的有效途径和必然选择。随着新一轮国
强调控制企业上市后风险,充分保障公众投资者权益的首发审核思路越来越清晰。$$    昨日,多家券商投行的保荐代表人透露,目前证监会发审委在IPO审核过程中,主要关注企业的六
报纸
在民族伟大复兴的新时代,中国国家形象与国际传播面临重大的挑战。中国古代战略文化传统在当代文明重塑中具有价值引领意义,以中国特色战略文化思维涵养民族优秀文化的核心理
目的:探讨快速康复外科(FTS)理念在老年患者腹腔镜肾癌根治性切除术围术期护理中的应用效果。方法:将86例老年肾癌患者按照随机数字表法分为观察组和对照组各43例,对照组围术
为明确我国目前施行GHS存在的问题,促进我国化学品分类与国际接轨,统一进出口要求,降低贸易壁垒,研究了《危险化学品名录》(2002版)与《联合国关于危险货物运输的建议书规章
目的探讨重复经颅磁刺激(repetitive transcranial magnetic stimulation,r TMS)治疗对孤独谱系障碍(autism spectrum disorder,ASD)患者事件相关电位(event-related potenti
当前在我国的警务实践中,警察鸣枪示警现象时有发生,暴露了不少问题:致人伤亡、鸣枪次数多及滥用,等等。这些案件产生了严重的社会危害:增加了社会的不安全因素,影响了公众的
通过对毕赤酵母中试发酵工艺的改进,建立一种简便可行的重组低出血抗凝蛋白EH(EPR-Hirudin,简称EH)的中试放大发酵工艺,并对经分离纯化得到的EH蛋白进行了质量检定方法、质量标准