基于深度强化学习的无人战车自主行为决策

来源 :火力与指挥控制 | 被引量 : 0次 | 上传用户:jjaijjai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高动态强对抗战场环境下,无人战车面临的自主行为决策问题,分析了未来陆战场无人战车实际作战需求,构建了基于马尔可夫决策过程的自主行为决策模型,提出了一种深度强化学习结合行为树的方法,利用行为树的逻辑规则与先验知识降低强化学习问题的难度,保证收敛性和鲁棒性,同时使行为决策模型具有学习能力。构建典型作战场景,验证深度强化学习结合行为树的无人战车自主行为决策方法的有效性。
其他文献
采用数理统计对比法,分析了1972—2020年晋中市终霜冻的时域分布特征及对果树花期霜冻灾害发生概率的影响。结果表明:晋中市近50年来平均终霜日为4月30日;终霜冻总体上北部晚
在AI兵棋对抗中,能够更全面地理解态势信息是AI棋手获胜的前提条件。提出了基于综合势力图的态势估计方法,阐述了势力图的原理和一般生成过程,提出基于综合势力图的态势分析
针对中国近海海空联合作战环境风险区划问题,选取水面舰艇航行、舰载机飞行、海上人员训练等作战样式,大风、大浪、低云低能见度、湿热、风寒等环境要素,高值频率、概率极值
针对磁阻力矩对小口径涡轮流量传感器性能影响较大,而对其定量计算又相当困难的问题,提出了利用计算流体力学(CFD)仿真获取磁阻力矩及轴与轴承间的摩擦力矩之和(T M)的方法,
利用离线得到的气动数据与动压传感器信息相结合,设计一种状态受限卡尔曼滤波器,对无人机所在水平面内的风速与风向进行在线估计,同时实时修正动压传感器的尺度因子。其数学
为了筛选出适合科尔沁左翼中旗无膜浅埋滴灌栽培技术条件下的高产玉米品种,对适应当地积温气候的11个品种进行对比试验。结果表明,11个参试玉米品种的产量均显著高于对照品种
气溶胶动态取样分析是指针对流动气体中掺混的气溶胶进行取样分析,目前气溶胶取样方法主要针对固体粒子气溶胶,而对于液态气溶胶的取样方法较少且未考虑到高湿环境对气溶胶取样结果的影响。为解决高湿环境下盐雾气溶胶这类典型液态气溶胶的动态取样问题,设计了盐雾气溶胶动态取样系统。取样采用等速取样原理,分析采用分光光度法,从而实现微量盐雾浓度高精度取样分析。取样器材料选择疏水聚四氟乙烯,并设计清洗流道结构,从而消
针对复杂的战场环境下目标环境机动性增强、传感器资源相对不足且单一传感器获取空间目标信息不完备问题,结合传感器节点自身的性能特征,考虑传感器的抗干扰性能等因素,提出
为了实现工业园区大气主要污染物的在线监测,设计了基于STM32的工业园区大气污染物高精度在线监测系统,实现了大气污染物H2S、NH3、VOCs的在线检测。在电路设计中,重点介绍了
总结了青冈县汉麻高产栽培技术,包括选地整地、种子预处理、适时播种、田间管理、病虫草害防治、适时收获等方面内容,以供种植户参考。