基于多智能体强化学习的轨道追逃博弈方法

来源 :上海航天(中英文) | 被引量 : 0次 | 上传用户:wangtian575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的多智能体深度确定性策略梯度(MADDPG)算法进行集中训练,得到各个追捕卫星和逃逸卫星的最优追逃策略参数;然后分布式执行使得多个追捕卫星和逃逸卫星之间能够完成追逃博弈.仿真结果表明:该方法能够完成集群卫星对非合作目标的追逃博弈,且能够利用数量优势有效地弥补速度劣势,涌现出“围捕”“拦截”“合作”“潜伏”等一系列智能博弈行为,有效地实现了博弈目的.
其他文献
对北京、上海、杭州7家举办郁金香花展的公园进行实地调查,结合文献研究,对我国球根花卉混栽的应用规模、应用类型、栽植方法和展示效果进行了分析对比.结果表明:2005年左右球根花卉混栽在我国郁金香花展中出现,至今已有不少公园有所应用,但应用规模小,混栽的球根花卉种类少,混栽设计水平有待提高.藉此提出郁金香花展中球根花卉混栽的应用建议.
以樱花的生物学特性为基础,通过梳理和分析上海地区樱花栽培养护过程中出现的问题,总结出樱花日常养护工作中面临的典型病症,并针对不同的病症,提出解决方案,为樱花的养护管理提供借鉴和指导.
草莓根腐病拥有发病广、为害重等特点,在很大程度上影响了草莓的种植,尤其是重茬连作更为严重.草莓根腐病表现为叶片出现黄褐色并伴随叶片卷缩、萎蔫亦或枯死的现象,大范围传播会导致草莓大面积死亡乃至颗粒无收.基于此,阐述了草莓根腐病的分类、病原和病症,及其农业、物理、化学和生物防治等措施,旨在为草莓的实际生产和根腐病防治提供参考.
制导武器和发射装置之间通常采用有线接触式数据通信和供电方式,为了适应未来快速装填、抗饱和攻击的需要,应加强对无线携能通信方式的关注.当前无线携能通信广泛采用了基于无线耦合的数据传输技术,但这在日益复杂的强电磁作战环境下易受干扰.针对强电磁环境下的可靠无线通信和传能需求,提出了一种基于光载波携能的无线发射数据通信系统.该系统利用可见光、红外光不易受电磁波干扰的特点,采用光载波调制、传输和解调技术,实现了制导武器和发射装置之间的可靠无线携能通信,弥补了传统无线携能通信在强电磁环境下易受干扰的不足,可应用于强电
江苏省中国科学院植物研究所自19世纪80年代开始蓝莓引种和适栽研究,经多年观察,认为南高丛蓝莓品种阳光蓝、木兰和蓝雨综合性状优良,适合在南京地区发展.同时,从土壤改良、肥水管理和整形修剪等方面总结了3个蓝莓品种的丰产高效栽培和管理技术.
由于图像数量多,因此准确、高效的目标检测是提升靶场光测图像处理自动化程度的关键步骤.针对低空目标图像及目标类型多、目标特性变化等情况导致传统目标检测算法适应性差的问题,提出了一种基于双重分类深度学习的低空目标自动检测方法.该方法基于深度学习目标检测框架YOLO V3,根据低空目标的亮度和形状的双重属性特征,将网络输出层中的单属性分类改进为双属性分类;基于目标区域生长实现样本自动标注,利用序列图像目标约束增加检测结果确认环节.靶场低空场景下的实际图像训练及检测结果表明:该方法初步检测成功率高于90%,后处理
随着“两山理论”的提出,绿色环保理念的盛行,森林生态旅游俨然成为行业和学术界关注的重点领域.以近30年森林生态旅游相关期刊、发表论文等文献为基础,对筛选的226篇期刊论文文献进行归纳整理,从国内文献载文时间与数量、期刊分布来源、研究主题、相关研究单位以及研究内容等5个方面进行综合分析.在资料分析基础上,通过理清相关研究文献思路,提炼出森林康养化和低碳化、森林旅游扶贫、自然和环境教育以及森林生态文化传播等新的研究态势,并提出应该增加各相关领域发展合作,进一步促进国内森林生态旅游快速、健康发展.
我国设施农业技术快速发展,设施设备在现代育苗温室环境调控方面作用越大.本研究简要介绍我国育苗温室环境调控设施设备及使用方法,旨在提高现代育苗认识,更科学、更高效为现代温室育苗提供有利环境,培育出优质种苗.
针对高轨远程转移抵近的机动策略优化问题,使用Pork-chop速度增量等高线图对时间约束内单脉冲Lambert转移进行分析.而后建立多脉冲转移抵近的数学模型,以燃料最省为优化目标,使用差分进化算法(DE)搜寻全局最优解.通过仿真验证在不同脉冲次数、不同时间约束情形下的轨道抵近计算,得出三脉冲转移抵近相对较优的结论.
压制干扰会淹没目标信号,使其无法被雷达检测,在强干扰下,雷达系统可能直接瘫痪.因此,研究对抗压制干扰的方法具有重要意义.为抑制压制干扰,可采用离散相位编码序列作为发射信号,以最小化发射信号距离旁瓣为准则,固定压制干扰信号经过匹配滤波器的输出水平和离散相位编码作为约束条件,构建优化问题模型;引入交替方向乘子法嵌套拟牛顿法(ADMM-BFGS)求解,并针对ADMM-BFGS算法计算复杂、耗时长的问题,提出一种交替方向乘子法嵌套类幂迭代法的复合算法ADMM-PMLI.仿真结果表明:相较于ADMM-BFGS,AD