特殊交通环境下移动车辆路径规划强化学习算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户：liuqin1225

【摘要】

：

【作者】

：

陈良

【出处】

：

北京交通大学

【发表日期】

：

2019年01期

【关键词】

：

路径规划场景建模强化学习深度强化学习 DDQN DDPG 贝塞尔曲线

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着智能化信息处理技术的不断进步,自动驾驶已成为近年来专家们的研究热点,路径规划则是其中的关键技术。智能的路径规划可以大大减少移动任务的完成时间,同时节约人力、物力成本,具有非常大的实用价值。本文从实际项目需求出发,针对所研究的特殊交通环境,使用PyQt5框架搭建满足场景特征的仿真平台。文中主要设计了两种基于强化学习的路径规划算法。一种是通过设计车辆标准的移动动作,利用深度强化学习中的DDQN算法训练移动路径。另一种是在使用三阶贝塞尔曲线模拟运动轨迹的基础上,提出改进的三段式路径生成算法和路径评价体系,然后利用深度强化学习中的DDPG算法训练三段式算法中的可变参数,实现移动路径的优化。本文的主要工作包括以下几个方面:(1)场景建模。本文利用PyQt5框架在PyCharm中设计并实现场景建模工具,仿照飞行甲板、储物仓库等实际场景,搭建仿真环境,环境的主要特征是具有边界轮廓、可停靠站位、障碍物和移动对象。(2)设计实现标准动作模式下的路径生成算法。本文提出,在车辆可行的角度区间内等间隔的选取若干角度,在每个角度下以一定的转弯半径和转弯角度做圆弧运动,构成离散的动作集合。设置奖励函数,利用DDQN算法进行训练。(3)设计基于贝塞尔曲线的三段式路径生成算法。算法包括生成和评价两部分,生成部分采用“圆弧形出站位-贝塞尔曲线转运-圆弧形入站位”的三段式方法,评价部分使用熵值法确定各个评价指标的权重系数,以优劣解距离法作为最终的评价函数。(4)三段式路径生出成算法的训练优化。本文设计的三段式生成算法中,存在若干决定最终生成路径的可变参数,基于此构造马尔科夫决策过程模型,利用DDPG算法进行训练,确定出一组最优参数值,优化三段式下的生成路径。本文利用设计的场景建模工具搭建了多个用于算法研究的场景,对提出的两种算法分别进行了大量仿真实验。实验结果表明两种算法均取得了较好的效果,对场景中任意给定的移动任务均能够规划出一条较为理想的路径。

其他文献

铜电解精炼车间设计方案探讨

<正>铜电解精炼即在阳极上的铜溶解,到阴极上析出,同时阳极上的杂质溶解或沉淀到电解液或槽底的一个电化学过程。电解精炼就是一个提纯和贵金属富集的过程。一般的生产企业阴

期刊

铜电解精炼阳极板始极片电解液循环阳极机组方案探讨

浅析湖南省郴州市龙形寨矿区锡多金属矿地质特征及找矿前景

龙形寨矿区位于湘南有色金属新发现矿产地--荷花坪锡多金属矿集区北部。通过对以往资料的分析、1/5千地质修测、1/5千高精度磁测、1/5千激电中梯测量、地表钻、槽探、浅井、

期刊

龙形寨锡多金属矿断裂破碎带型磁异常

个体化美罗培南治疗铜绿假单胞菌感染老年患者的临床经验

目的:探讨个体化美罗培南对感染铜绿假单胞菌老年患者的有效性及安全性。方法:110例经细菌培养已证实铜绿假单胞菌感染的老年肺部感染患者,随机分成两组,美罗培南常规剂量组

期刊

铜绿假单胞菌个体化用药美罗培南

调查肖窑取得的新收获

<正> 以往发现的肖窑窑址.主要分布在肖县东南白土镇的四周.1986年11月,在该镇又发现了新的窑址,为研究肖窑历史提供了新资料.现将调查情况简述如下.一、调查情况白土镇内偏

期刊

新收获

基于粗糙集的快速KNN文本分类算法

传统K最近邻一个明显缺陷是样本相似度的计算量很大,在具有大量高维样本的文本分类中,由于复杂度太高而缺乏实用性。为此,将粗糙集理论引入到文本分类中,利用上下近似概念刻

期刊

文本分类K最近邻粗糙集

薪酬激励的效用递减问题探析

本文主要从薪酬激励的概念和目的着手,分析了传统的薪酬激励的弊端,以及传统的薪酬激励中出现的边际效用的现象,从而初步解释了存在这种边际效用的原因,初步提出了一些解决这

期刊

薪酬激励边际效用满意度期望绩效

SBR法间歇式活性污泥系统处理有机废水的实验研究

以生粉和调和油水溶液模拟有机废水,采用SBR(Sequencing Batch Reactor)法对其进行处理,以水样浊度作为评价指标,对SBR反应工序、水样浊度与吸光度的标准曲线以及SBR法对有机

期刊

SBR有机废水工序标准曲线浊度吸光度实验研究

找准发展基点勇于乘势而为——访江苏华宏科技股份有限公司董事、总经理胡品龙

新年伊始,万象更新。作为国内再生资源加工设备行业的知名企业——江苏华宏科技股份有限公司,也传来了"公司业绩受益于行业的景气发展保持稳定增长"的利好消息。江苏华宏科技

期刊

江苏华宏科技股份有限公司综合服务提供商世界级总经理制造商再生资源回收再生资源加工

读《菜根谭》品官德经

一、淡泊明志，修德正心$$ 翻开历史上一些清官廉吏的传记就会发现，大凡清官廉吏皆以淡泊明志。没有清新淡泊的志趣，而贪财好利，以荣华富贵为志向，就很难做到清廉不贪，古往今来大

报纸

二语写作教学中限时作文训练的有效性研究

本项研究运用问卷、访谈等方法调查91名英语专业三年级学生对二语写作教学中限时作文训练的心理倾向，并计算了9名学生学期末和开学初限时作文的得分差。结果表明，将限时作文和

期刊

二语写作教学限时作文不限时作文

特殊交通环境下移动车辆路径规划强化学习算法研究

与本文相关的学术论文