特殊交通环境下移动车辆路径规划强化学习算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:liuqin1225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能化信息处理技术的不断进步,自动驾驶已成为近年来专家们的研究热点,路径规划则是其中的关键技术。智能的路径规划可以大大减少移动任务的完成时间,同时节约人力、物力成本,具有非常大的实用价值。本文从实际项目需求出发,针对所研究的特殊交通环境,使用PyQt5框架搭建满足场景特征的仿真平台。文中主要设计了两种基于强化学习的路径规划算法。一种是通过设计车辆标准的移动动作,利用深度强化学习中的DDQN算法训练移动路径。另一种是在使用三阶贝塞尔曲线模拟运动轨迹的基础上,提出改进的三段式路径生成算法和路径评价体系,然后利用深度强化学习中的DDPG算法训练三段式算法中的可变参数,实现移动路径的优化。本文的主要工作包括以下几个方面:(1)场景建模。本文利用PyQt5框架在PyCharm中设计并实现场景建模工具,仿照飞行甲板、储物仓库等实际场景,搭建仿真环境,环境的主要特征是具有边界轮廓、可停靠站位、障碍物和移动对象。(2)设计实现标准动作模式下的路径生成算法。本文提出,在车辆可行的角度区间内等间隔的选取若干角度,在每个角度下以一定的转弯半径和转弯角度做圆弧运动,构成离散的动作集合。设置奖励函数,利用DDQN算法进行训练。(3)设计基于贝塞尔曲线的三段式路径生成算法。算法包括生成和评价两部分,生成部分采用“圆弧形出站位-贝塞尔曲线转运-圆弧形入站位”的三段式方法,评价部分使用熵值法确定各个评价指标的权重系数,以优劣解距离法作为最终的评价函数。(4)三段式路径生出成算法的训练优化。本文设计的三段式生成算法中,存在若干决定最终生成路径的可变参数,基于此构造马尔科夫决策过程模型,利用DDPG算法进行训练,确定出一组最优参数值,优化三段式下的生成路径。本文利用设计的场景建模工具搭建了多个用于算法研究的场景,对提出的两种算法分别进行了大量仿真实验。实验结果表明两种算法均取得了较好的效果,对场景中任意给定的移动任务均能够规划出一条较为理想的路径。
其他文献
<正>铜电解精炼即在阳极上的铜溶解,到阴极上析出,同时阳极上的杂质溶解或沉淀到电解液或槽底的一个电化学过程。电解精炼就是一个提纯和贵金属富集的过程。一般的生产企业阴
龙形寨矿区位于湘南有色金属新发现矿产地--荷花坪锡多金属矿集区北部。通过对以往资料的分析、1/5千地质修测、1/5千高精度磁测、1/5千激电中梯测量、地表钻、槽探、浅井、
目的:探讨个体化美罗培南对感染铜绿假单胞菌老年患者的有效性及安全性。方法:110例经细菌培养已证实铜绿假单胞菌感染的老年肺部感染患者,随机分成两组,美罗培南常规剂量组
<正> 以往发现的肖窑窑址.主要分布在肖县东南白土镇的四周.1986年11月,在该镇又发现了新的窑址,为研究肖窑历史提供了新资料.现将调查情况简述如下.一、调查情况白土镇内偏
期刊
传统K最近邻一个明显缺陷是样本相似度的计算量很大,在具有大量高维样本的文本分类中,由于复杂度太高而缺乏实用性。为此,将粗糙集理论引入到文本分类中,利用上下近似概念刻
本文主要从薪酬激励的概念和目的着手,分析了传统的薪酬激励的弊端,以及传统的薪酬激励中出现的边际效用的现象,从而初步解释了存在这种边际效用的原因,初步提出了一些解决这
以生粉和调和油水溶液模拟有机废水,采用SBR(Sequencing Batch Reactor)法对其进行处理,以水样浊度作为评价指标,对SBR反应工序、水样浊度与吸光度的标准曲线以及SBR法对有机
新年伊始,万象更新。作为国内再生资源加工设备行业的知名企业——江苏华宏科技股份有限公司,也传来了"公司业绩受益于行业的景气发展保持稳定增长"的利好消息。江苏华宏科技
一、淡泊明志,修德正心$$ 翻开历史上一些清官廉吏的传记就会发现,大凡清官廉吏皆以淡泊明志。没有清新淡泊的志趣,而贪财好利,以荣华富贵为志向,就很难做到清廉不贪,古往今来大
报纸
本项研究运用问卷、访谈等方法调查91名英语专业三年级学生对二语写作教学中限时作文训练的心理倾向,并计算了9名学生学期末和开学初限时作文的得分差。结果表明,将限时作文和