行为树在自动驾驶行为规划策略中的应用研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:qq540531049
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶技术致力于解决交通拥堵并减少交通事故,近年来发展迅速。其中一个关键的开放问题是,根据周围交通状况选择有效驾驶行为的行为规划策略。目前的大量技术实现都以有限状态机作为全场景的整体策略模型,但是有限状态机内部模块之间存在强耦合,需要专业知识手动设计,步骤繁琐,不利于更新和维护。而最新的分场景研究方法则往往以单个强化学习智能体面向整个场景进行训练,存在状态空间维度高,训练难度高,基于神经网络的策略无安全保障等问题。基于此,本文提出使用模块化程度更高、可扩展性更强的行为树模型代替有限状态机作为行为规划策略的主模型。行为树的结构与子节点设计结合遗传编程算法和强化学习算法,以适应不同场景的策略规划需求。具体而言,本文的主要工作内容有:1)在CARLA模拟器中构建包含行人和其他障碍车辆的3种不同交通场景——带有信号灯的十字交叉路口、多车道直行路段和环岛路段,并建立行为树策略所需的基本条件节点和动作节点;2)通过分析行为树的冗余节点,规范化行为树的结构,以缩小遗传编程的搜索空间,并在此基础上设计实现加入了dropout遗传操作和哈希集合的遗传编程算法;3)设计并训练加入了深度Q学习(Deep Q-Learning,DQN)的行为树策略,有针对性地解决环岛汇入这一复杂场景的行为策略设计。最后,整合分场景中的子策略形成完整行为规划策略的行为树模型。根据在CARLA模拟器中各场景的实验测试结果,证明使用行为树构建自动驾驶行为规划策略,能够有效地与遗传编程算法和强化学习算法相结合,达到降低手动设计成本和强化学习训练难度,增强强化学习智能体安全性的目的。
其他文献
如今,信息化技术的飞速发展,在我国很多行业领域中发挥着至关重要的作用。而我国铁路运输行业也逐渐意识到信息化的重要性,纷纷加大了对审计信息化的建设力度,形成了完善的信息管
近年来,我国电于政务迅猛发展.基础设施建设取得积极成效.核心业务应用不断深化.信息安全保障能力显苦提升。然而,电子政务发展中各自为政、信息孤岛、重复建设的现象依然存在。充
本文对住宅小区消防车道现状进行了系统的分析、归纳,并针对总结出的几点问题,提出了解决的方法对策,希望对住宅小区消防车道治理工作起到一定指导作用。
目的探讨供肝动脉变异类型,术中损伤原因及植入前重建的方法。方法1993年10月至2004年12月,中山大学附属第三医院肝脏移植中心共行供肝切取和修整术600例,术中记录肝动脉变异
随着社会经济的快速发展,职业倦怠普遍存在于各个行业中,对人们的日常工作及生活造成不利影响。现有研究表明,教师群体在高压状态下,心理及生理容易受到消极影响,从而产生职业倦怠。作为教师群体的一员,幼儿教师由于教育对象为幼儿存在特殊性,工作内容比较繁琐,需要承担安全责任,同时面临多重角色转换的问题,这使得幼师群体成为职业倦怠研究的焦点之一。本研究选取厦门市不同办园体制幼儿园,对265名幼儿教师进行研究。
近年来,旅游活动中人们日益追求健康、养生,“大健康”产业大发展极大满足了人们的这种需求,不断进入人们的生活视野。而结合二者的康养旅游,顺应市场发展前景,潜力不可估量
在汉语作为第二语言教学中,培养汉语学习者的汉语语感是教学的核心目标和基本任务。正确把握现代汉语的节奏有助于提高汉语学习者的汉语语感。就汉语而言,诗歌,尤其是格律诗
Castleman病(CD)属淋巴增殖性疾病,又称巨大淋巴结增生或血管滤泡性淋巴组织增生,属原因未明的反应性淋巴结病之一。临床较为少见,术前诊断困难,我科收治2例Castleman病,手术
当前,生态危机日益严重,我国在探索人与自然和谐相处的道路上还有很长的路要走,构建生态文明是实现中国梦不可或缺的组成部分。如何提升公民的生态文明意识是一个值得深思的
研究目的:1.硫酸软骨素镁的合成及理化性质检测;2.探讨硫酸软骨素镁对于骨关节炎软骨的作用;3.初步探讨硫酸软骨素镁对于骨关节炎动物模型的修复效果。研究方法:1.离子交换树