Actor-Critic框架下的多智能体决策方法及其在兵棋上的应用

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:lovele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将人工智能应用于兵棋推演的智能战术兵棋正逐年发展,基于Actor-Critic框架的决策方法可以实现智能战术兵棋的战术行动动态决策。但若Critic网络只对单算子进行评价,多算子之间的网络没有协同,本方算子之间各自行动决策会不够智能。针对上述方法的不足,提出了一种基于强化学习并结合规则的多智能体决策方法,以提升兵棋推演的智能水平。侧重采用强化学习对多算子的行动决策进行决策分析,并结合产生式规则对战术决策进行规划。构建基于Actor-Critic框架的多算子分布执行集中训练的行动决策模型,对比每个算子互不交
其他文献
目的探究基于风险识别的群组管理对冠状动脉CT血管成像(CTA)检查依从性及图像质量的影响。方法选取2019年1—12月收治的冠心病、均至少接受1次64层CT冠状动脉血管检查患者114
随着我国教学的不断优化改革在教学中不再仅仅重视学生的个人文化素养与,越来越重视学生的其他素养的培养,同时更加重视学生身心的发展状况,因此在当前教学中逐渐开展了心理
两名小朋友去野餐,他们分享带来的美食:2瓶果汁平均分给他们两人,每人可分得1瓶;4个苹果平均分给他们两人,每人可分得2个;12块饼干平均分给他们两人,每人可分得6块。1个大蛋
“大类招生”“分流培养”是当前高等院校教育的一大创举,是通识教育背景下培养社会主义现代化人才的重要尝试。一方面,它顺应了人才发展的客观规律,有利于因材施教地培养出
练兵备战的主战场在基层,监督执纪的主阵地也在基层。锻造能打仗、打胜仗的过硬基层,旅团部队纪检监察工作必须紧贴备战打仗,靠上去主动服务、融进去发挥作用。
针对导弹部队多波次作战任务规划问题,依据无人机的实时数据,构建了基于路径的多层规划模型,并设计了模型的算法求解流程。使用遗传算法与禁忌搜索混合算法,得出了任务规划中的最优路径规划,并在此基础上进行了冲突的消除。通过仿真案例表明,用无人机协同配合导弹部队作战,实时传输作战数据,能够解决战场信息模糊不确定的问题;使用多层规划模型能够为导弹多波次规划作战的路径进行科学的决策和选择。利用遗传算法和禁忌搜索
目的探讨超声检查在头颈部肿瘤放疗后颈动脉损伤评估中的应用价值。方法选取60例头颈部肿瘤接受放疗后患者为病例组,同期选取54例新确诊头颈部肿瘤未作任何治疗的患者为对照
目的:探讨脂多糖(LPS)诱导大鼠急性肝损伤的机制。方法:对SD大鼠腹腔注射10 mg/kg LPS 24 h后,比较对照组(3只)与LPS组(3只)大鼠外周血转氨酶水平;取肝组织制片后HE染色观察
文章以趣味田径项目在小学体育教学中的开展运行做以论述,通过教学理念、教学形式、教学示范、教学延伸等不同层面上,趣味性的有效融入与合理执行,提出了其在小学体育教学中
目的探讨游离脂肪酸(FFA)及脂代谢相关因子脂联素(APN)、视黄醇结合蛋白-4(RBP4)与2型糖尿病肾病的关系。方法选取收治的56例2型糖尿病患者以及同期健康体检者31例,根据2014