基于深度强化学习的兵棋推演决策方法框架

来源 :国防科技 | 被引量 : 0次 | 上传用户：q3821713

【摘要】

：

针对兵棋推演的自动对抗问题,文章提出基于深度学习网络和强化学习模型来构建对抗策略。文章结合深度强化学习技术优势,立足多源层次化的战场态势描述,提出面向智能博弈的战

【作者】

：

崔文华李东唐宇波柳少军

【机构】

：

国防大学

【出处】

：

国防科技

【发表日期】

：

2020年2期

【关键词】

：

兵棋推演深度强化学习态势表示压缩学习方法深度迁移学习 wargamingdeep reinforcement learningsituation rep

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对兵棋推演的自动对抗问题,文章提出基于深度学习网络和强化学习模型来构建对抗策略。文章结合深度强化学习技术优势,立足多源层次化的战场态势描述,提出面向智能博弈的战场态势表示方法;将作战指挥分层分域的原则同即时策略游戏中的模块化和分层架构相结合,提出一种层次化和模块化深度强化学习方法框架,用于各决策智能体与战场环境交互的机制以及对抗策略的产生;为满足实际作战响应高实时特点,提出压缩的深度强化学习,提升模型输出速度;为改善对不同环境的适应性,提出利用深度迁移学习提升模型泛化能力。

其他文献

生物质石墨烯锦纶/涤纶抑菌纺织品开发与性能

将GN与T分别以N/T47/53、GN/T47/53、GN/T57/43、GN/T85/15比例混合纺14.8tex,捻系数358的紧密赛络纱,并织成橫密145/5cm、平方米质量155g/m^2相同规格纬平针针织物(其中N为

期刊

生物质石墨烯锦涤纶织物致病菌改良振荡烧瓶法抑菌活性

分报告之四:2012年中国证券投资咨询业务发展回顾与展望第三章证券投资咨询业务发展展望

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

会议

中药苍耳子化学成分的研究

苍耳了系菊植物苍耳Xanthium sibiricum Part. 的带总苞的成熟果实,为中医临床较常用中药.

期刊

化学成分醋酸镁反应针状结晶硅胶柱色谱

防地雷反伏击车设计浅谈

本文介绍了防地雷反伏击车的设计要点。这种防地雷反伏击车是一种能够为士兵提供抵御地雷、简易爆炸装置和其他枪弹威胁的改进防护的战斗用车。涉及防地雷装甲车辆的总体设计

期刊

防地雷反伏击V型导偏结构人员输送装甲防雷mine resistant ambush-protectedV deflectionpersonnel tra

检测纳米微粒粒径方法的研究

用光子相关法、原子力显微镜和扫描电镜三种测试方法测定了同一标准样品的粒径,比较了三种测试方法在纳米粒径检测方面的特点.光子相关法给出纳米微粒的平均粒径和多分散系数

期刊

纳米微粒粒径检测光子相关法原子力显微镜扫描电镜nanoparticle measurement of partide diameter PCS AFM

美军战略传播中的“叙事”策略

随着互联网技术的飞速发展,信息传播对国家政治、经济、外交和国防带来巨大冲击和影响。美军意识到传播叙事是政府和军队塑造形象、谋划战略、输出文化价值观的重要手段。美

期刊

战略传播叙事策略信息心理战strategic communicationnarrative strategyinformation psychologic

智能化条件下的国家安全管理

迅速发展的智能化技术彻底打破传统国际战略对抗模式,不断扩大国际行为主体的能力代差使得资本与技术获得“超级权力”,给社会安全带来一系列新的挑战,进一步加剧人们的“技

期刊

信息技术智能化国家安全information technologyintelligentnational security

基于深度强化学习的兵棋推演决策方法框架

其他学术论文