基于强化学习的无人车路径规划的研究与实现

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:jsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各个科技领域的进步,智能机器人开始渗入到各个行业,其中智能车自动驾驶的研究与开发也越来越受到人们的重视。在无人车自动驾驶的研究中,路径规划和在动态环境中自主避障是当前研究的主要问题。避障原理是无人车先通过安装的车载感知器获得自身位置和周围环境信息,尤其是与周围障碍物的距离,然后计算出当前无人车与障碍物的最小安全距离,生成安全避障策略,自动控制无人车安全避障。路径规划同样需要依靠感知器感知周围障碍信息,以及探测目标位置。使用栅格对无人车行驶路径进行划分,利用Q-learning算法生成Q-table列表,计算无人车每个位置的价值,使用贪心策略生成直达目的地的最优路径,使无人车自动沿着最优路径行驶至目标位置。本文主要研究了强化学习中的神经网络算法和Q-learning算法理论及其解决无人车在未知动态环境中的避障和路径规划问题,具体完成的工作有:第一,根据现实车辆行驶路径情况,运用python语言在PyCharm平台上搭建了无人驾驶智能车系统,主要包括动、静障碍物设置,目标点设置,无人车行驶方式设置,这些是无人车自动驾驶实验的基础设置条件。第二,通过分析无人车避障方法以及可能遇障方式的分析,研究了无人车安全避障的约束条件,通过将BP神经网络算法与约束条件相结合,生成了无人车在未知动态环境中的安全避障策略,成功控制无人车安全驶离危险区。第三,建立栅格环境,利用Q-learning算法进行仿真,指出由于训练过程中由于过早的降低探索因子,使得规划的路径并不是最优。因此改进传统的自动驾驶路径探索方式,使所有的动作策略得到充分探索利用,得到全局最优规划路径。通过规定最大训练次数保证训练效率,从而从两方面达到的实验效果和实验时间上的双重最优。第四,为了更加优化路径规划策略,提高实验效率,提出一种新的训练学习方法——分层训练。将整个系统环境划分为几个独立的区域,让无人车分别在有价值的区域内训练学习,进行局部规划,节省在无价值区域内的探索训练时间,训练完成后,将各区域的信息归总到Agent中,实现整体规划,最终在整个环境中生成到达目标位置的最优路径,提高学习效率。经过仿真实验证明,本文提出的优化方法在无人车自主控制避障和自主路径规划方面具有积极作用。推动无人车避障和路径规划研究的发展,对于实现无人车自动驾驶的现实实际应用具有重要意义。
其他文献
特征声线搜索以及传播时间测定的精确性是基于声传播时间的声速剖面反演的关键。在具有倾斜海底的三维海域,声线在海底的反射会导致水平偏转,给特征声线搜索和声传播时间计算
近二十多年来,配合物研究已成为无机化学、晶体化学和材料化学等学科的前沿课题。具有含氮配体如邻菲罗啉和联吡啶的配合物合成与结构表征更是配位化学中一个引人注目的研究
美国作家福克纳及其作品《押沙龙,押沙龙!》一直受到国内外文学批评界的关注。作为福克纳创作巅峰期的一部力作,小说讲述主人公托马斯·塞得潘一生致力于追求他的“宏伟蓝图”,
隐私权作为一项法律权利,它的发端可以追溯到十九世纪。1890年,塞缪尔·沃伦(Samuel Warren)与路易斯·布兰代斯(Louis Brandeis)提出了隐私权的概念。从此,隐私权在美国逐步
永磁同步电动机以其体积小、效率高、可靠性好以及对环境的适应性强等诸多优点,在各种高性能驱动系统中得到了广泛应用。永磁同步电动机的矢量控制可以获得很高的性能,该系统
介绍了居民身份证登记指纹信息的关键技术、业务流程、系统框架和技术路线,简要说明居民身份证登记指纹信息在"人证同一性认定"方面的目的意义,以及对于公民社会生活发挥的作
随着社会经济和科学技术的飞跃进步,企业的运营环境在最近十几年里发生了巨大的变化。过去那种相对单纯和比较稳定的内外环境已不复存在,取而代之的是一个极为复杂而又急剧变
目的:观察电针经筋结点治疗缺血性脑卒中急性期下肢瘫痪的临床疗效。方法:将48例缺血性脑卒中急性期下肢瘫痪患者以随机数字法随机分为观察组与对照组,各24例。观察组予电针经
最近在全球范围爆发的WannaCry勒索病毒,造成了大量计算机用户恐慌,特别是校园网用户。WannaCry勒索病毒实质上是一种蠕虫性质的病毒,蠕虫病毒最大的特征就是交叉感染,而控制
民和县是一个纯农业县。草业在农业生产中占的比例不断提高,随着种植业结构的调整,草业发展也面临诸多问题,本文通过对民和县草业现状及制约因素的分析,提出今后草业发展对策