【摘 要】
:
针对强化学习(RL)中存在的鲁棒性问题,综述了鲁棒强化学习(RRL)的研究进展和在航天控制中的应用与展望.首先阐释了鲁棒强化学习的基本内涵;然后从引入H∞控制理论的鲁棒强化学习、域随机化方法、鲁棒对抗强化学习3个类别分析总结了鲁棒强化学习研究的主要方法;最后分析了鲁棒强化学习在航天控制中的应用,并面向未来复杂化、智能化的航天工程任务,提出了值得研究的问题和发展方向.
【机 构】
:
哈尔滨工业大学航天学院,哈尔滨150001
论文部分内容阅读
针对强化学习(RL)中存在的鲁棒性问题,综述了鲁棒强化学习(RRL)的研究进展和在航天控制中的应用与展望.首先阐释了鲁棒强化学习的基本内涵;然后从引入H∞控制理论的鲁棒强化学习、域随机化方法、鲁棒对抗强化学习3个类别分析总结了鲁棒强化学习研究的主要方法;最后分析了鲁棒强化学习在航天控制中的应用,并面向未来复杂化、智能化的航天工程任务,提出了值得研究的问题和发展方向.
其他文献
为贯彻落实省、市新时代县域警务工作系列会议精神,深入实施“四个大抓”警务战略,永州市公安机关聚焦乡镇街道学校风险防控这个关键层级,以打造“护校安园工程”“智慧安防工程”和“环境净化工程”创建活动为载体,进一步打造永州特色的标准化、制度化、规范化“平安校园”升级版.
2018年,岳阳经开区被评为“湖南省平安校园建设先进县市区”,这是岳阳市中心城区唯一获得该荣誉称号的区.近年来,该区高度重视校园安全管理和建设,紧紧围绕创建目标,不断加大安全工作人、财、物的投入,逐步完善校园安全人防、物防、技防体系.并积极推进平安校园建设,多次获评全市综合先进单位,营造了和谐平安的校园环境.
针对目前地面目标热红外通道辐射特性及其偏振辐射特性的遥感探测需求,将五大典型地面目标之一——土壤作为研究对象,并利用地物热红外多角度偏振遥感测量平台及仪器获取了不同因素影响下的土壤热红外多角度热辐射与偏振辐射数据。分别从探测角、方位角、波段、偏振角和土壤类型五个方面研究了土壤的热辐射特性及其偏振辐射特性。结果表明,当入射光源固定时,土壤的辐射亮度和亮度温度均随探测角的增大而增大;当方位角为180°
自6月初以来,全省多地普降大到暴雨,以降雨集中、降水量大、持续时间久的迅猛突发之态势,引发了山洪暴发、江河水位突涨、泥石流频发等不同程度的灾情,造成干支线公路水毁严重,边坡塌方、路基掏空、路面深陷、洪水淹没路面、泥石流覆盖路面等安全隐患出现,许多路段一度中断交通.
6月初的一天,记者来到湖南兰天集团的公共安全体验馆,刚进馆门,便看见几批老年参观团陆陆续续从里面出来,这更加激起了记者的好奇心:这究竟是一个什么样的体验馆,会引来一批又一批的人参观体验?随着湖南兰天集团“四馆”馆长周年芳逐一向记者介绍才得知,这只是该集团公司从2017年开始,陆续投资2.2亿元,精心打造的“四馆两场一基地”(红馆、国防教育馆、汽车博物馆、公共安全体验馆、专业试驾场、卡丁车场、预备役装备训练综合基地)其中的一个馆所而已,“每一个馆所所展示的东西不一样,蕴含的意义也大不相同.”
基于红外探测系统对小体积制冷型红外探测器的应用需求,提出了一种新型非真空制冷型红外探测器小型化封装技术。阐述了其结构和工艺设计要点,实现了组件封装并通过耦合J--T制冷器进行了相关性能测试。结果表明,本文所述的设计方案可实现128×128元(15 m)InSb芯片封装,组件尺寸小于等于Φ20 mm×15 mm,重量约为5 g,性能比现有产品显著提升,探测成像性能可以满足使用要求。该组件的启动时间可达到4 s以内,蓄冷时间目前为6 s,制冷性能在后续研究中联合制冷器设计可以得到进一步优化。
碲锌镉(Cadmium Zinc Telluride,CZT)是碲镉汞(Mercury Cadmium Tellu-ride,MCT)红外焦平面器件的重要衬底材料,其合成过程存在强烈的放热现象.因此控制放热是CZT多晶材料合成工艺平稳进行的基本条件.通过改变初始旋转倾角可有效调控合成反应的放热强度和放热速率:大倾角有利于获得缓慢且稳定的工艺过程.基于实验结果和热力学计算分析可知,合成反应经过镉-碲的液-固相反应和液-液相反应两个阶段完成.同时实验结果表明,反应的放热量大小决定了在高温下是否会发生第二次反应
目前基于卫星遥感的火点探测主要采用千米级分辨率的中红外波段数据,而对红外各波段火点探测灵敏度的定量研究很少,不利于充分发挥红外波段信息在火情监测中的作用。首次利用混合像元分解方法来定量分析分辨率为150 m、300 m和1 km的各红外波段在火点监测应用中的差异。结果表明,150 m分辨率中红外通道比1 km分辨率通道的火点探测灵敏度高30倍左右;300 m分辨率远红外通道可探测百平方米量级的火点