基于元深度强化学习方法的智能博弈决策模型研究

来源 :军事运筹与系统工程 | 被引量 : 0次 | 上传用户：ahphone

【摘要】

：

针对陆军装甲分队博弈对抗决策问题,在分析深度强化学习方法在构建智能博弈对抗决策模型适用性基础上,对基于马尔科夫决策过程的陆军装甲分队博弈对抗过程模型进行了形式化描述,提出了基于元深度强化学习的博弈对抗决策模型,给出了分队战术平台下基于元深度强化学习的智能博弈对抗策略生成与优化框架.研究成果可为智能博弈对抗问题的解决提供一种思路.

【作者】

：

徐志雄曹雷陈希亮

【机构】

：

陆军边海防学院,陕西西安710100;陆军工程大学指挥控制工程学院,江苏南京210007

【出处】

：

军事运筹与系统工程

【发表日期】

：

2021年3期

【关键词】

：

智能化指挥控制深度强化学习元学习陆军装甲分队博弈对抗

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

军队战略管理评估工作总体框架研究

着眼新时代军队战略管理内在要求,提出军队战略管理评估是指围绕服务支撑军队建设重大决策,在军队战略管理过程中运用科学方法手段开展的评价和估量活动,设计构建了军队战略管理评估工作总体框架,即开展战略评估,制定军事战略;进行战争设计,生成作战需求;统筹建设改革备战,形成解决方案;配置国防资源,推进战略执行;检验绩效能力,反馈支撑决策.

期刊

军队战略管理评估工作总体框架

联合作战指挥体系评估组织实施问题研究

联合作战指挥体系评估,是推进军队联合作战指挥体制改革的重要理论支撑和实践依据.指挥体系评估主要由评估主体、评估对象、评估目的、评估程序、评估人员、评估方法、评估结论等基本要素组成.指挥体系评估组织程序分为评估准备阶段、实施阶段和形成评估结论阶段等三个阶段.总结了指挥体系评估的四种方法,为我军联合作战指挥体系评估提供了一定的实践参考.

期刊

指挥体系评估组织构成组织程序评估方法

基于连续体近似法的特大城市公交系统规划研究

公交普线规划因服务对象时间、空间的分散性,是大城市公交系统中最难规划的部分.本文分析了大规模多中心城市地区公交网络分层级功能及规划次序,重点针对普线网提出基于运营商和用户广义成本最低的连续体近似法模型搭建方法.通过确定区域网络的普线总服务距离,总停靠站数,以及发车间隔等决策变量的最佳值,使公交运营企业和乘客在单位时间内的广义预期成本最小化.利用本文提出的方法,对北京市进行区域划分,重新优化普线网,并基于北京市路网和兴趣点分布,校核规划的理想网络,得到能够实施的设计网络.相比现状网络,优化后的方案在成本控制

期刊

城市交通公交系统规划连续体近似法广义成本网格布局

数据驱动的共享单车停放区规划方法研究

从宏观和微观两个角度研究共享单车停放区规划方法,宏观层面解决停放区选址定容问题,微观层面进一步优化每个停放区内部的停车位布局问题.宏观层面利用DBSCAN对共享单车停/取点进行聚类分析得到停/取需求点;然后考虑共享单车使用者路径选择、停/取点选择和停放区服务能力约束,建立混合整数线性规划模型优化停放区选址及容量.微观层面充分考虑行人、自行车与汽车之间的影响,其中行人和自行车采用改进社会力模型进行仿真,并考虑共享单车使用者最优停放区选择;汽车采用智能驾驶模型进行仿真.停车位布局通过仿真通行效率及混合交通流风

期刊

交通工程停放区规划建模仿真共享单车混合整数规划仿真优化

基于元深度强化学习方法的智能博弈决策模型研究

其他学术论文