基于分层强化学习及人工势场的多Agent路径规划方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:luming123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对路径规划算法收敛速度慢及效率低的问题,提出了一种基于分层强化学习及人工势场的多Agent路径规划算法。首先,将多Agent的运行环境虚拟为一个人工势能场,根据先验知识确定每点的势能值,它代表最优策略可获得的最大回报;其次,利用分层强化学习方法的无环境模型学习以及局部更新能力将策略更新过程限制在规模较小的局部空间或维度较低的高层空间上,提高学习算法的性能;最后,针对出租车问题在栅格环境中对所提算法进行了仿真实验。为了使算法贴近真实环境,增加算法的可移植性,在三维仿真环境中对该算法进行验证,实验结果表明该
其他文献
目的探讨巨细胞病毒(cytomegalovirus,CMV)在患者中的感染情况及与共患疾病的关系。方法分析广州市某三甲医院门诊和住院患者的CMV血清学资料。化学发光法检测CMV的IgM和IgG
目的探究在对患者进行医学检查中,在技术治疗管理中存在的问题及分析对策。方法本次实验对象选自2017年12月~2018年12月在本院接受临床检查的100例患者,对其进行检查后,对检
【“望”:病例观察】  下面是“小数的性质”教学时,教师遭遇到的尴尬情形。  师:以元为单位,3角怎么表示?  生:0.3元。  师:那30分呢?  生:0.30元。  师:以米为单位,3分米怎么表示?  生:0.3米。  师:那30厘米呢?  生:0.30米。  师:你发现了什么?  生:0.3元=0.30元,0.3米=0.30米。  教师擦去单位名称,剩下0.3=0.30,问:那现在相等吗? 
目的观察丁苯酞注射液治疗急性脑梗死的临床疗效及对超敏C反应蛋白(hs-CRP)的影响。方法选取2012年10月至2014年11月医院收治的急性脑梗死患者90例,按治疗方法不同分为对照组和
对初中地理课堂教学进行观察发现,许多课堂的教学内容抽象、晦涩,学生的学习兴趣不高,知识学习的浅表化、碎片化和死记硬背等现象较为严重。为此,基于深度学习理念和初中生的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的观察贝那普利联合脂必泰胶囊在高血压合并高脂血症患者中的应用效果。方法选取我院2016年2月~2019年1月初治高血压合并血脂异常患者244例,随机分为试验组(123例)和对照组
在知识大爆炸和信息高速发展的二十一世纪,现代企业正面临着新的竞争环境和格局,企业中的人才成为成败的关键因素。因此,企业中的领导必须审时度势,根据不断变化的外部环境,
<正>夏末秋初是养殖户补栏养过年鸡的时机,特别是养殖日龄最长的阉鸡。为了能赶上春节销售旺季,目前不少养鸡专业户补栏积极,纷纷购进鸡苗阉割饲养。传统上用来阉割的鸡多数
目的探讨高压氧对高血压脑出血患者术后脑血管动力学及神经功能指标的影响。方法从我院2011年10月~2014年10月诊治的高血压脑出血(HCH)患者中,选取41例常规治疗的患者作为对