面向无人驾驶的增强学习算法研究

来源 :电子科技大学 | 被引量 : 10次 | 上传用户:haifeng123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人驾驶是当前世界学术界极具挑战性的热点研究领域,具有重要的研究意义。本文利用增强学习算法,依托于实验室深度学习服务器平台,使用增强学习算法对虚拟环境下车辆的无人驾驶进行研究,实现了一个在车行驶时能够为车提供驾驶决策的方法。主要研究工作如下:针对虚拟环境下的车辆行驶,利用增强学习来研究无人驾驶问题,完成面向无人驾驶的增强学习算法设计。增强学习方法是一种模型未知条件下进行学习的重要方法,并且很多RL方法都是将某一个目标作为长期的优化目标。在连续空间很大以及状态未知的时候,可以利用深度增强学习方法构建深度网络,实现对目标的控制决策。在目标运行过程中,算法能实时反馈出当下车辆的运行情况,并且能够根据该情况进行试错学习。相较于传统的深度学习,利用深度增强学习算法让车辆去学习策略,这种学习更接近于人类学习的方式。针对训练深度神经网络时出现的车辆行驶不平滑,以及训练时间过长的问题,提出基于残差学习的深度增强学习算法,对设计好的深度网络进行改进。为了使得网络学习能力增强,理论上可以无限增加网络的层数。然而事实表明,随着深度网络的网络层数增加,网络的学习性能会退化。因而,我们将残差学习思想引入本文算法中。在网络输出值之后,利用残差网络预先进行值判断,然后滤波,剔除网络输出时变化较大的不合理值。随后再进行边界判断,重新赋值。加入残差学习一者能使得目标车辆行驶过程中更为平滑,二者能够有效减少训练时间,缩短训练周期。本文重要的工作就是依托于实验室深度学习服务器平台,实现了在虚拟环境下,车辆行驶时能够为车提供驾驶决策的增强学习方法。利用这个深度学习服务器平台,能够在一个虚拟的环境中进行模拟实验。且实车试验面临价格非常贵成本高,危险性大等很多问题,而这些问题,在仿真环境中可以忽略。因此在虚拟环境下进行模拟驾驶仿真实验是非常有必要的。又因为车辆无人驾驶过程中的控制与决策问题是一个具有大规模连续空间以及多个优化目标的复杂序贯决策问题,利用传统的动态规划方法不易求取其值,有鉴于此,提出了本文的面向无人驾驶的增强学习控制算法。
其他文献
<正>~~
退耕还林政策能够有效改善我国生态环境恶化现象,但是退耕还林的后续问题也需要得到进一步的重视,在实行退耕还林政策之后,当地的经济情况会有一定的变化,地区之间的经济发展
政治思想的重要作用之一就是其工具性,"王权至上"作为一种政治思想观点和政治实践,是商王通过一定的强制方式赋予其合理性和政治合法性,并胁迫臣民服从而完成的。"王权至上"固化
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
由于新舟60飞机APU排气噪声辐射较严重,为了确定一种最佳的降噪方案,必须对新舟60飞机APU排气噪声的频谱特性和指向性进行测量并分析。从测量结果可以看出,无论APU工作在哪种
<正>赤点石斑鱼俗称红斑。目前,国内外的许多学者已经对多种海水鱼类,例如大黄鱼、美国红鱼、红笛鲷、黑鲷苗种等慢慢地引进低盐水域养殖,并且取得了较好的经济效益。但就赤
<正> 刚进腊月,我就接到妹妹打回家的电话:“姐姐,我今年回家过年……”“妹妹要回家过年了!妈妈,妹妹要回家过年啦!”我迫不及待的把这个消息告诉刚跨进门的妈妈。“好啊!我
福建一直是全国推广普通话的重点区域,60年来,福建推普工作取得了较显著的成绩,也面临着不小的困境。时至今日,福建"地方普通话"仍然无法消除"交际中的方言隔阂",不少福建人
介绍了移动终端WiFi测试,针对测试中存在的漫游性能测试和大范围移动连接性能测试问题,分析了改进测试场景的方法,着重设计了在实验室条件下由系统硬件和控制软件组成的模拟
教师在教学过程中都会有自己的语言习惯,虽然不能简单断定这些语言谁优谁劣,但总的来说,教师还是应该不断训练自己教学用语,尽量使其更规范、准确.本文分析初中数学课堂中教