基于深度强化学习的无人战车自主行为决策

来源 :火力与指挥控制 | 被引量 : 0次 | 上传用户：jjaijjai

【摘要】

：

针对高动态强对抗战场环境下,无人战车面临的自主行为决策问题,分析了未来陆战场无人战车实际作战需求,构建了基于马尔可夫决策过程的自主行为决策模型,提出了一种深度强化学

【作者】

：

张耀武富春王明段宏张昭王海龙

【机构】

：

北方自动控制技术研究所

【出处】

：

火力与指挥控制

【发表日期】

：

2021年4期

【关键词】

：

无人战车火力打击决策强化学习行为树

【基金项目】

：

兵器工业联合基金资助项目(6141B011504)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对高动态强对抗战场环境下,无人战车面临的自主行为决策问题,分析了未来陆战场无人战车实际作战需求,构建了基于马尔可夫决策过程的自主行为决策模型,提出了一种深度强化学习结合行为树的方法,利用行为树的逻辑规则与先验知识降低强化学习问题的难度,保证收敛性和鲁棒性,同时使行为决策模型具有学习能力。构建典型作战场景,验证深度强化学习结合行为树的无人战车自主行为决策方法的有效性。

其他文献

晋中市终霜冻发生特征及其对果树的影响

采用数理统计对比法,分析了1972—2020年晋中市终霜冻的时域分布特征及对果树花期霜冻灾害发生概率的影响。结果表明:晋中市近50年来平均终霜日为4月30日;终霜冻总体上北部晚

期刊

终霜冻发生特征花期霜冻山西晋中19722020年

基于综合势力图的态势估计方法

在AI兵棋对抗中,能够更全面地理解态势信息是AI棋手获胜的前提条件。提出了基于综合势力图的态势估计方法,阐述了势力图的原理和一般生成过程,提出基于综合势力图的态势分析

期刊

综合势力图态势估计兵棋对抗人工智能

中国近海海空联合作战环境风险综合区划方法

针对中国近海海空联合作战环境风险区划问题,选取水面舰艇航行、舰载机飞行、海上人员训练等作战样式,大风、大浪、低云低能见度、湿热、风寒等环境要素,高值频率、概率极值

期刊

中国近海海空联合作战环境风险综合区划层次分析法互反判断矩阵

小口径液体涡轮流量传感器数学模型的研究

针对磁阻力矩对小口径涡轮流量传感器性能影响较大,而对其定量计算又相当困难的问题,提出了利用计算流体力学(CFD)仿真获取磁阻力矩及轴与轴承间的摩擦力矩之和(T M)的方法,

期刊

涡轮流量传感器数学模型CFD特性曲线平均仪表系数线性度误差

基于固定翼无人机平台的风矢量估计

利用离线得到的气动数据与动压传感器信息相结合,设计一种状态受限卡尔曼滤波器,对无人机所在水平面内的风速与风向进行在线估计,同时实时修正动压传感器的尺度因子。其数学

期刊

固定翼无人机平台卡尔曼滤波矢量估计

通辽市科尔沁左翼中旗春玉米耐密高产优质品种鉴选

为了筛选出适合科尔沁左翼中旗无膜浅埋滴灌栽培技术条件下的高产玉米品种,对适应当地积温气候的11个品种进行对比试验。结果表明,11个参试玉米品种的产量均显著高于对照品种

期刊

春玉米生育期农艺性状产量内蒙古通辽科尔沁左翼中旗

高湿环境下盐雾气溶胶动态取样系统

气溶胶动态取样分析是指针对流动气体中掺混的气溶胶进行取样分析,目前气溶胶取样方法主要针对固体粒子气溶胶,而对于液态气溶胶的取样方法较少且未考虑到高湿环境对气溶胶取样结果的影响。为解决高湿环境下盐雾气溶胶这类典型液态气溶胶的动态取样问题,设计了盐雾气溶胶动态取样系统。取样采用等速取样原理,分析采用分光光度法,从而实现微量盐雾浓度高精度取样分析。取样器材料选择疏水聚四氟乙烯,并设计清洗流道结构,从而消

期刊

盐雾气溶胶微量高湿等速取样分光光度法

一种基于粒子群优化算法的异构传感器分配方法

针对复杂的战场环境下目标环境机动性增强、传感器资源相对不足且单一传感器获取空间目标信息不完备问题,结合传感器节点自身的性能特征,考虑传感器的抗干扰性能等因素,提出

期刊

异构传感器传感器感知能力定量评价模型粒子群优化算法方法分配方法

工业园区大气污染物高精度在线监测系统设计

为了实现工业园区大气主要污染物的在线监测,设计了基于STM32的工业园区大气污染物高精度在线监测系统,实现了大气污染物H2S、NH3、VOCs的在线检测。在电路设计中,重点介绍了

期刊

工业园区在线监测STM32大气污染物气体浓度检测

青冈县汉麻高产栽培技术

总结了青冈县汉麻高产栽培技术,包括选地整地、种子预处理、适时播种、田间管理、病虫草害防治、适时收获等方面内容,以供种植户参考。

期刊

汉麻栽培技术高产黑龙江青冈

基于深度强化学习的无人战车自主行为决策

与本文相关的学术论文