基于模型集成深度强化学习的智能车决策控制研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:alangao12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机运算性能的持续提升,人工智能得到了极大发展,在很多领域的应用中表现不俗。智能车是目前车辆发展的方向,而决策控制是其最重要的关键技术之一,实现智能车的普及,必须解决其决策控制问题。在智能车决策控制领域中,深度强化学习(DRL)相比较于传统的基于规则的方法具有很多优点,基于规则的决策控制策略制定相当繁琐,并且难以考虑复杂驾驶环境中的所有问题,因此其适应性差,而DRL算法可以避免这些问题。本文将DRL算法应用于智能车技术研究,旨在解决智能车在连续动作空间的决策控制问题。首先设计了可以应用于智能车决策控制领域的经验分类深度确定性策略梯度(ECDDPG)算法。分析人类在驾驶过程中如何对当前驾驶环境进行决策,并比较其与DRL算法在决策表现中的异同性。基于深度确定性策略梯度(DDPG)的算法框架,针对其训练过程不稳定,训练时间长,收敛速度慢的缺点,进行了相关改进。引入了车辆动力学模型,用于判断智能体在与环境交互过程中产生样本的合理性。对经验回放池进行了分类,分别存放不同种类的经验样本,智能体也会从中学习,学习后的策略会避免产生不合理的和危险的动作。对产生的经验样本进行优先级排序,优先学习质量高的经验,提高学习效率,并且对于重复学习的样本,降低其优先性,避免策略陷入局部最优。提出了在复杂环境下的分层决策控制方法,以超车工况为例,对基于DQN的驾驶动作决策模块进行相应的建模。其次对比了多种可以用于验证DRL算法的驾驶仿真平台,分析对比各种软件的特点,最终选取TORCS软件作为本文的仿真环境。对TORCS软件的使用,通讯方法,接口设计,传感器设置,以及对车辆操作的动作指令进行了详细说明。提出了DRL算法和软件仿真的系统架构。对仿真平台的搭建和算法的设计进行了详细说明,包括仿真的硬件和软件环境,神经网络的设计,奖励函数的设计。详细分析了仿真任务的环境数据信息,提出了多个指标项累积的奖励函数形式,智能体会通过极大化奖励函数值的方式来采取动作。最后对实验结果进行了相关分析。ECDDPG的回合平均回报值在训练过程中较DDPG算法上升更稳定,并且收敛速度更快。本文设计的ECDDPG算法相较于原始DDPG算法效率提升约27%。分析了所提出算法的泛化性能,通过将跑道环境更换为没有训练过的环境,算法控制车辆跑完了全程,说明算法的泛化性良好。在策略的控制作用下,安全完成了超车。结果表明,文中所设计的算法可以应用于智能车的决策控制。
其他文献
随着我国经济大力发展,国民收入有了显著的提升,汽车行业也在改革开放近30年来得到了大力的发展,如今已经成为国家经济支柱中重要的一块,中国市场也在早期国家通过市场换技术
随着互联网的发展,社交软件已经成为人们生活必不可少的一部分,人们可以用社交网站或社交软件进行普通日常交流、学术交流和投票选举等等活动。在线社会网络的大量增长,这为
现有的视频拷贝检测算法没能将视频的空间域特征与时间域特征有效结合起来,从而在检测性能上仍有很大的提升空间。虽然一些基于卷积神经网络(Converlutional Neural Network,
随着我国零售业的不断发展,目前中国网络零售依靠流量红利高速发展的时代已经逐渐过去,未来线上线下将协同发展,相互促进,其中自动售货行业由于其成本较低、占地面积小、24小
场景语义理解是计算机视觉领域的重点问题之一,它是计算机通过模拟人类视觉功能感知真实世界的主要工具。随着深度学习在计算机视觉领域的广泛应用,物体检测、实例分割等问题
计算机视觉是一门利用硬件和算法让计算机从图片中或视频中读取信息的科学。计算机视觉包含图像分类技术、对象检测技术、目标跟踪技术、语义分割技术和实例分割技术等多种技
妊娠期高血压疾病(hypertensive disorders complicating pregnancy,HDCP)为妊娠与高血压并存的一组疾病,严重威胁母胎健康。妊娠状态是女性极为特殊的时期,而高血压这种全身系统性疾病,不仅危害孕妇健康,也对胎儿造成不良影响,作者拟使用超声参数评估晚孕期的HDCP母胎心功能及胎儿生长发育,密切监测孕期情况,避免不良临床结局的发生。本研究选取150例孕妇,年龄
近年来,随着无线通信的迅猛发展,天通信系统的无线信号的发送端和接收端的天线也取得了质的进步。天线的实际应用越来越广泛,涉及安防,智能家居,移动智能产品,智能门禁等领域
涡扇发动机在民用航空和军事工业中有着广泛的应用,是国家综合国力的重要体现。由于涡扇发动机工作环境恶劣、结构复杂且可靠性要求高,需要设计先进控制系统满足其性能与安全
机器阅读理解是人工智能领域非常热门的一个研究方向。其目的是根据用户的问题,通过语义分析、文章内容的检索和评价等一系列操作,从给定的文章中找到可以准确回答用户问题的