基于无模型强化学习的无人车辆防碰撞横向控制策略研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wohaha163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着IT技术和传感器技术的发展,无人车辆相关技术已经成为目前的热点研究方向。本文针对无人车辆的防碰撞功能需求,结合强化学习技术,对无人车辆防碰撞横向控制策略进行研究,主要研究内容如下。首先,对车辆进行运动学和动力学建模,确定控制器的输入量和输出量。引入环境包络线作为控制器的约束条件,针对环境包络线不平滑缺陷,研究了一种环境包络线平滑化的改进方法。结合强化学习技术对控制系统结构进行设计,并优选出REINFORCE算法和DDPG算法。接着,结合REINFORCE算法,设计了神经网络控制器。针对强化学习中样本数值和方差过大的问题,对经验池数据进行预处理改进。结合无人驾驶工况,针对强化学习的奖励稀疏问题,提出了一种针对无人车辆行驶场景的奖励塑造改进策略。路径跟踪、避障和跟踪-避障混合实验结果表明,该控制策略能够优先执行避障任务随后执行路径跟踪任务,跟踪误差约0.2m,横摆角速度和侧向速度最大幅值分别为0.3rad/s和0.3m/s,皆小于其稳定性阈值0.75rad/s和2.8m/s,可以安全稳定地进行无人车辆路径跟踪和避障多任务控制。然后,根据DDPG算法原理设计神经网络控制器,并研究其策略探索方案。路径跟踪、避障和跟踪-避障混合实验结果表明,该控制策略也能够优先执行避障任务随后执行路径跟踪任务,跟踪误差最大为0.04m,横摆角速度和侧向速度最大幅值分别为0.35rad/s和0.3m/s,也分别小于其稳定性阈值0.75rad/s和2.8m/s,可以安全稳定地进行无人车辆路径跟踪和避障多任务控制,且控制精度更高。从控制精度、响应速度和稳定性3个方面,对比两种控制策略,优选出基于DDPG算法的无人车辆防碰撞横向控制策略。最后,将基于DDPG算法的无人车辆防碰撞横向控制策略实现于工控机平台和TX2平台,并进行路径跟踪、避障和路径跟踪-避障混合实验。实验结果表明,跟踪误差最大为0.04m;横摆角速度和侧向速度最大幅值分别为0.3rad/s和0.4m/s,分别小于其稳定性阈值0.75rad/s和2.8m/s;工控机平台控制量生成最大用时0.00467s,TX2平台控制量生成最大用时0.02388s,分别小于设定的控制周期0.01s和0.03s。因此,该控制策略可实现于工控机平台和TX2平台,具备可迁移性,且迁移后的控制精度、稳定性和实时性良好。本文研究分析了两种基于无模型强化学习的无人车辆防碰撞横向控制策略,在二者中基于DDPG算法的无人车辆防碰撞横向控制策略控制精度更高,响应速度更快,且满足车体稳定性要求,是本文最优的一种可行的无人车辆防碰撞控制方案。
其他文献
电力系统安全稳定运行是现代社会稳定发展的重要基础和支撑,由于现代电力系统具有多维度、非线性的特点,利用传统数学模型方法对电力系统暂态稳定性进行评估已难以满足需求。随着人工智能方法的发展,研究人员将机器学习引入到电力系统暂态稳定性评估。因此论文利用多层感知机网络的复杂特征提取能力,提出了一种基于集成学习与多层感知机相结合的电力系统暂态稳定性评估方法。论文主要研究内容如下:首先,论文分析了电力系统暂态
学位
随着“双碳”目标的提出,大规模新能源接入电力系统将成为趋势,其波动性、间歇性以及随机性将对电力系统柔性调控提出新挑战。分布式潮流控制器作为一种以分布式结构为特点的柔性输电设备,其功能性、经济性与灵活性远优于目前的集中式柔性输电设备,是未来电网柔性调控中高性价比的替代者。本文首先对目前国内外柔性输电设备的发展历程进行了综述,对现阶段分布式潮流控制器没有突破的难题进行了总结,解释了分布式潮流控制器控制
学位
氢燃料电池汽车在行驶过程中只会产生水和热量,没有其他污染气体生成,因此成为新能源汽车研究领域的一个热点。在氢燃料电池汽车中,氢燃料电池是其主要动力来源,但是氢燃料电池的输出电压较低,不稳定,其输出电能汽车无法直接使用,需要使用DC/DC变换器对氢燃料电池的输出进行变换。为此,本文以DC/DC变换器为研究对象,完成了氢燃料电池车用DC/DC变换器研究与设计。本文完成的主要工作内容和取得的结果如下:(
学位
数字化转型可助力实体经济高质量发展,利于缓解经济下行压力、建设现代化经济体系。选取2012—2020年A股上市公司数据,对数字化转型、开放式创新与实体经济高质量发展的三者关系进行分析。结果表明:数字化转型可通过促进开放式创新推动实体经济高质量发展;开放式创新在数字化转型和实体经济高质量发展之间发挥中介效应;当开放式创新水平高于门槛值后,数字化转型可驱动实体经济高质量发展;在国有类实体经济中数字化转
期刊
在全球化背景下,日益开放多变的市场环境、复杂的客户需求以及新技术的迅猛发展等因素导致制造企业所面临的竞争愈演愈烈,传统集中式单工厂生产模式很难快速响应市场需求的动态变化。为了在日益激烈的市场竞争中得以生存与发展,企业纷纷通过建立新的工厂、与其他企业进行合作生产以及兼并收购其他企业等举措提高企业的竞争力,这使得分布式制造成为重要的制造模式。分布式调度问题(DSP)作为分布式制造的重要环节,以工厂之间
学位
燃料电池作为新兴清洁能源,其高效率、低排放、低噪声的优点受到了国内外政府、学者的关注和重视。而现阶段大部分采用单一的氢气控制系统或者单一的空气控制系统已经越来越不适用于大功率氢燃料电池中对氢气和空气压力调节的需求。为此,本文在分析氢燃料电池供气系统的结构、工作流程以及各子系统控制要求的基础上,研究并设计了DSP作为主控制器的氢燃料电池供气控制系统,实现氢气空气协调控制。本文的主要研究工作和取得的研
学位
制造业是我国经济支柱,而生产调度是制造业的重要环节,对提升制造水平至关重要。含并行机阶段的生产调度问题是制造领域广泛存在的一类问题,具有高度复杂性,相应优化技术直接影响生产制造问题的优化质量。本文研究了两种含并行机阶段的调度问题:不相关并行机调度问题(unrelated parallel machine scheduling problems,UPMSP)和两阶段装配流水车间调度问题(two-st
学位
随着我国对生态文明建设的不断推进,传统的高能耗、高污染的工业模式逐步转向可持续、可循环的绿色经济模式。天然气具有清洁环保、经济实惠、安全可靠等优点,是未来能源发展的重要方向。我国大部分天然气是通过沿海液化天然气(LNG,Liquid Natural Gas)接收站进口而来,天然气的广泛使用带来海上LNG贸易运输的繁荣。近年来我国沿海港口已建设多个大型LNG接收站,海上LNG运输船对国内港口来说属于
学位
骨龄是骨骼发育进程的年龄描述,是人体组织结构和生理功能发育程度的重要标志。骨龄评估(Bone Age Assessment,BAA)是目前最常用的生物年龄评估方法,在临床医学、体育竞技和司法判案等领域有着重要作用。目前,最常用的骨龄评估方法仍为传统的人工判读方法,基于手部X光片图像,由医师对照图谱进行人工推断。人工方法存在主观性强、专业技能要求高、评估效率低等问题。而一些基于计算机辅助的评估方法,
学位
锂离子电池的体积小、质量轻且能量密度高,目前被广泛应用在各个领域。但是在其使用过程中,仍存在安全性和可靠性的问题,需要对锂离子电池的工作状态进行综合管理。在锂离子电池的管理系统中,其剩余寿命预测是保障电池安全工作的关键技术。论文对锂电池的研究目的是为了实现对其剩余寿命的精确预测,提升锂电池在使用过程中的安全性与可靠性。针对锂电池剩余寿命预测研究,主要完成了以下工作内容:引入美国国家航空航天局提供的
学位