论文部分内容阅读
无人驾驶是当前世界学术界极具挑战性的热点研究领域,具有重要的研究意义。本文利用增强学习算法,依托于实验室深度学习服务器平台,使用增强学习算法对虚拟环境下车辆的无人驾驶进行研究,实现了一个在车行驶时能够为车提供驾驶决策的方法。主要研究工作如下:针对虚拟环境下的车辆行驶,利用增强学习来研究无人驾驶问题,完成面向无人驾驶的增强学习算法设计。增强学习方法是一种模型未知条件下进行学习的重要方法,并且很多RL方法都是将某一个目标作为长期的优化目标。在连续空间很大以及状态未知的时候,可以利用深度增强学习方法构建深度网络,实现对目标的控制决策。在目标运行过程中,算法能实时反馈出当下车辆的运行情况,并且能够根据该情况进行试错学习。相较于传统的深度学习,利用深度增强学习算法让车辆去学习策略,这种学习更接近于人类学习的方式。针对训练深度神经网络时出现的车辆行驶不平滑,以及训练时间过长的问题,提出基于残差学习的深度增强学习算法,对设计好的深度网络进行改进。为了使得网络学习能力增强,理论上可以无限增加网络的层数。然而事实表明,随着深度网络的网络层数增加,网络的学习性能会退化。因而,我们将残差学习思想引入本文算法中。在网络输出值之后,利用残差网络预先进行值判断,然后滤波,剔除网络输出时变化较大的不合理值。随后再进行边界判断,重新赋值。加入残差学习一者能使得目标车辆行驶过程中更为平滑,二者能够有效减少训练时间,缩短训练周期。本文重要的工作就是依托于实验室深度学习服务器平台,实现了在虚拟环境下,车辆行驶时能够为车提供驾驶决策的增强学习方法。利用这个深度学习服务器平台,能够在一个虚拟的环境中进行模拟实验。且实车试验面临价格非常贵成本高,危险性大等很多问题,而这些问题,在仿真环境中可以忽略。因此在虚拟环境下进行模拟驾驶仿真实验是非常有必要的。又因为车辆无人驾驶过程中的控制与决策问题是一个具有大规模连续空间以及多个优化目标的复杂序贯决策问题,利用传统的动态规划方法不易求取其值,有鉴于此,提出了本文的面向无人驾驶的增强学习控制算法。