空间认知导向下利用分层强化学习的最优路径规划

来源 :武汉大学学报(信息科学版) | 被引量 : 0次 | 上传用户:DownLoad0006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对空间认知导向下模型驱动型路径规划和人们认知偏好多样性之间的矛盾,提出了一种基于分层强化学习的交互学习型路径规划方法。该方法将最优路径标准转换为路口处转向决策的瞬时奖励值,并通过预学习和实时学习两个阶段实现高效地发现总奖励值最大的最优路径策略。其中,预学习阶段自动发现子目标节点,并构建包含局部最优策略的子任务;实时学习阶段利用预定义策略实现高效的Q值更新,并根据Q值追溯最优路径。实验表明,该方法具有足够好的实时性和最优性。 In view of the contradiction between model-driven path planning and people’s cognitive preference diversity under spatial cognition, an interactive learning path planning method based on hierarchical reinforcement learning is proposed. This method transforms the optimal path standard into the instantaneous reward value of the steering decision at the intersection. Through the two stages of pre-learning and real-time learning, the optimal path strategy with the largest total reward value is found efficiently. Among them, sub-target nodes are automatically found in pre-learning phase, and sub-tasks including local optimal strategies are constructed. In real-time learning phase, efficient Q value updating is achieved by using predefined strategies and the optimal path is traced based on Q values. Experiments show that this method has good enough real-time and optimality.
其他文献
目的探讨全程干预对异基因造血干细胞移植患者营养状况的影响。方法将128例异基因造血干细胞移植患者随机分成两组,观察组67例患者营养状况采用全程护理干预,对照组61例患者
非连续变形分析(DDA)方法考虑了岩体结构面对稳定的影响,融入了变形的不连续性和时间概念,更加符合崩塌体变形破坏的复杂过程。应用DDA对贵州山区典型的软硬岩互层构造+不合理采
黑牦牛、藏细毛羊是青海地区重要的禽畜种类,是青海地区珍贵的畜种资源之一。常年放牧、逐水草而居,容易感染肝片形吸虫病。肝片吸虫病为慢性消耗病,为黑牦牛、藏细毛羊养殖
决策树是用来解决分类问题的重要方法之一。ID3是决策树学习的核心算法,为此,本文给出了决策树构造思想和ID3决策树学习算法,并将其应用于教学评价之中,这样可以提高教学评价技术
长征精神作为中国共产党人的政治本色,激励和鼓舞着全国人民奋发图强、砥砺前行。探讨长征精神与中华民族伟大复兴的关联性,做好赓续和弘扬长征精神,对于走好新时代长征路、
绿色发展理念是中共十八届五中全会提出的五大发展理念之一,是指导当下生态文明建设的核心理念,它对于教育的发展同样具有重要的指导意义。在绿色发展理念背景下,高校思政教育需
患者男,32岁,已婚,汉族,农民,小学文化.因反复发作阴茎、双上肢回缩伴惊恐不安、头昏乏力2mo余于2001年5月10日人院.患者于2mo前某日夜晚突然感觉生殖器变小回缩,伴心悸、出
基于一款自主研发的以LPC1788芯片作为主控制器的低成本触摸屏,研究了基于em Win图形库的人机交互界面的软件设计。触摸屏底层设计采用三缓冲技术,通过SPI中断读取触摸屏控制
我国木结构建筑具有显著的特色,无论从籼出、木架结构、墙体围护、屋顶形式还是装饰方面都富有自己传统特色。中国古建筑非常重视造型与空间的变化,运用木材、石材、砖瓦、琉璃