基于深度强化学习的拟人化自适应巡航控制算法设计

来源 :吉林大学 | 被引量 : 0次 | 上传用户:tower2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自适应巡航控制(Adaptive Cruise Control System,ACC,下同)又称主动巡航控制。作为一种高级驾驶辅助功能,自适应巡航控制系统通过车载雷达等传感器监测汽车前方的道路交通环境,与本车信息对比后,对车辆进行纵向速度控制,使本车与前车保持合适的安全间距。为了向乘客提供舒适的驾驶体验,并使周围的驾驶员能够更好地理解本车的行为,自适应巡航控制算法的驾驶风格应接近人类驾驶员,因此需要设计一种可以模仿人类驾驶风格的自适应巡航控制算法,即拟人化的自适应巡航控制算法。目前自适应巡航控制算法主要分为基于规则的自适应巡航控制算法和基于学习的自适应巡航控制算法。在基于学习的自适应巡航控制算法设计中,大部分研究者采用单层深度强化学习算法搭建自适应巡航算法,并使用专家估计法设计奖励函数。由于单层强化学习算法不符合人类“决策-执行”的行为模式,且专家估计法设计的奖励函数没有基于真实驾驶数据对奖励函数进行拟人化改进,因此基于这种方法很难进行拟人化的自适应巡航控制算法设计。为了解决这些问题,本文以分层强化学习算法作为基础框架设计了一种新的自适应巡航控制算法,并基于逆向强化学习算法从真实跟驰驾驶数据中学习了拟人化的决策策略,最终实现了拟人化自适应巡航控制算法。本文的主要工作内容如下:基于分层强化学习设计了一种新的自适应巡航控制算法。本文模仿人类“决策-执行”的行为模式,以分层强化学习算法作为基本框架,以深度Q网络算法(Deep Q Network,DQN,下同)作为上层决策算法和底层执行算法搭建了自适应巡航控制算法,并基于安全性、舒适性和跟随性初步设计了奖励函数。通过改进DQN算法优化了自适应巡航算法的学习速度和实际表现。针对初始DQN算法训练效率低等问题,本文对DQN算法的神经网络结构、记忆存取和算法训练流程进行了改进,形成了一种新的耦合DQN算法。仿真结果显示耦合DQN算法相比原DQN算法在学习效率和实际表现方面有了明显提升。基于逆向强化学习从真实驾驶数据学习拟人化的驾驶策略。本文采集了某熟练驾驶员在城市开放道路驾驶的真实驾驶数据作为检验样本,并基于最大熵逆向强化学习理论设计了拟人化自适应巡航控制算法奖励函数的学习算法,经过特征映射、状态转移概率计算、期望特征计算和奖励函数系数更新等过程,使算法轨迹的期望特征值更接近人类驾驶数据的期望特征值,完成了自适应巡航控制算法驾驶策略的拟人化学习。自适应巡航控制算法训练和拟人化效果对比。本文基于真实驾驶数据样本设计了训练工况,分别开展简单和复杂工况下的底层执行算法预训练,然后使用相同的工况对自适应巡航控制算法整体进行训练。算法测试结果表明本文设计的拟人化奖励函数的安全性、舒适性和跟随性期望特征值更接近人类驾驶数据的期望特征,即完成了拟人化自适应巡航控制算法设计。
其他文献
窄矩形通道具有结构紧凑、换热效率高等特点在核动力系统、微电子冷却系统、航天器冷却系统等领域得到广泛应用。窄矩形通道由于几何尺寸限制与常规通道内汽泡行为有所不同,所以窄通道内汽泡行为已成为近年来的研究热点,目前已有文献已针对单面加热通道内汽泡行为进行了大量研究,然而实际加热的窄矩形通道内窄边拐角处热流密度大且热边界层的相互扰动所发生的复杂汽泡行为与单面加热通道有所区别,因此,不能简单使用单面加热流道
由于城市扩张减少了生产性耕地的供应,城市化通常被视为对粮食安全的威胁。但是,我发现城市化实际上可以起到相反的作用,增加耕地面积用于农业生产。对于像中国这样人口密集
如今高速公路上流量负荷不断增大,高速公路交通系统将面临着十分严峻的挑战,高速公路管理部门需要简明直观的信息辅助决策。但随着高速公路上数据日益增加,反映交通状态的参数种类也在不断增加,管理者很难在这些繁杂的信息中找到需要的重点信息。为了对日益拥堵的高速公路提供更好的管理对策,本文选取在交通诱导、交通控制时最关注的因素:行程时间作为主要研究对象,其中主要研究内容如下:实现更加精确有效的行程时间估计,需
煤炭作为我国的主要能源,燃烧排放了大量SO2等污染气体,近几年民用燃煤SO2的污染问题日益加剧。型煤固硫技术工艺简易、成本低,有利于民用燃煤清洁高效燃烧。固硫剂的选择是
<正>回顾我科2例肱骨近端骨折脱位病例的诊治过程,并组织专家对其诊断、治疗策略的制定、治疗结果的评估及术后康复锻炼建议等进行讨论。本文2例肱骨近端骨折脱位相对简单,没
eSIM技术是一种将传统的SIM卡直接完成嵌入处置的技术资源。将这一技术成熟的应用于物联网领域,可以为物联网的进一步优化发展提供帮助。因此,本文首先对eSIM技术在物联网之
【摘 要】新时代的发展,在很大程度上更新并完善了我国的教育事业,而对于小学语文教学而言,则是进一步提高了对阅读教学的重视。特别是群文阅读这一教学模式,其阅读方面所达到的效果深受学生与教师的认可。对此,文章将对开展小学语文群文阅读相关策略进行简要分析。  【关键词】核心素养;小学语文;群文阅读  一、简要分析群文阅读教学的主要价值  第一,扩展文化视野。在小学语文教学中应用群文阅读教学模式,不仅能增
社会因素、医院因素等诸多方面因素造成当下医患关系紧张难解。如何缓解?文章从互相信任是构建和谐医患关系的基础、提高医疗服务质量是构建和谐医患关系的根本、加强职业道德
急性髓系白血病(acute myeloid leukemia,AML)是一组具有高度异质性的血液系统恶性肿瘤。近年来成人AML(非APL)患者经标准"3+7"方案治疗后,完全缓解率可达70%-80%。但由于有微小残留
随着我国经济的高速发展,大气污染日益严重,雾霾频发,并且向着多种污染源、多种污染物的方向发展。大气气溶胶不仅会对气候、空气质量产生影响,还会对人体健康产生危害,已经成为制约经济、社会发展亟待解决的问题。大气中的有机物种众多,有机物参与的成核已经成为了近年来的研究热点,其中有机胺和有机酸已被证实可以在成核中起重要作用。芳香酸是大气中一类常见有机酸,已有研究证明少量的芳香酸的存在就可以促进硫酸-水体系