虚拟环境中基于深度强化学习的车辆驾驶策略优化研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:wujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能驾驶是互联网浪潮下汽车行业变革的重大机遇,同样也是从互联网时代转型到人工智能时代过程中不可或缺的一环,其中,车辆的驾驶策略是智能驾驶的核心。目前,基于深度强化学习生成车辆驾驶策略存在着样本数据获取成本大以及训练效率低的问题。针对上述问题,本文对如何使用车辆运动仿真方法生成高质量驾驶经验数据的问题进行了研究,除此之外,还研究了如何基于该驾驶经验数据,提升深度强化学习生成车辆驾驶策略时的训练效率。本文所做的主要工作内容如下:(1)针对数据获取难度大、成本高的问题,提出了一种在虚拟环境中充分利用场景中的结构化信息以及运动约束进行车辆运动仿真的方法。在仿真过程中,基于横向曲率以及纵向运动的双重约束生成车辆的参考轨迹,并使用一种级联的横纵分离的控制策略来控制车辆跟踪该轨迹,其中,模型预测控制器负责控制车辆的方向转角,比例积分微分控制器负责控制车辆的油门与刹车。结果显示,基于该车辆运动仿真方法生成的驾驶经验数据达到了专家级别的水平。(2)针对高维图像输入导致计算复杂度高以及训练效率低的问题,提出了一种基于模型的深度强化学习方法,让智能体能够在低维的状态空间中并行的探索车辆驾驶策略。该方法首先基于专家驾驶经验数据学习了3个模型来实现对驾驶环境机理的表征,分别是将高维场景观测数据压缩为低维抽象编码的变分自编码器模型、预测执行驾驶行为后环境状态如何转移的循环神经网络、以及环境-行为映射模型。然后以环境-行为映射模型的权重为协方差自适应矩阵进化策略的初始亲本进行进化,并在多核的CPU处理器上,创建多个智能体对进化出的子代进行评估,实现车辆驾驶策略的并行探索。结果显示,基于该方法生成驾驶策略时,训练效率有所提升,驾驶策略也更为稳定。以CarRacing-v0游戏场景为仿真驾驶平台,分别构建了城市交通的场景以及舰面保障车的作业场景,对生成的车辆驾驶策略进行了应用。结果显示,该驾驶策略能够缩短车辆的通行时间,提高出行的效率,其在面临不同类型的交叉口时也能够保障车辆平稳通过。
其他文献
财政部公布的2018年末全国地方政府债务余额为18.39万亿元,这部分可以认为是显性债务,但由于存在隐性债务,实际债务总量难以精确计量。地方举债是一把“双刃剑”:一则,地方政府的合理举债可以缓解地方财政赤字,聚集社会资金建设当地的基础设施,提高人民的生活水平,有利于促进经济增长;二则,过度的政府举债可能会反向拉升税收压力,抑制私人投资欲望,后续的兑付压力和无法及时承兑的风险会逐步攀升,最终影响地方
学位
“技术决定论”的传统强调媒介技术对社会的绝对影响力,忽略了人在技术采纳和使用中的能动性。本文从技术驯化论的视角出发,考察随迁老人在微信趣缘群中的互动模式,探寻这一使用方式嵌入到随迁老人日常生活脉络的机制。通过对W社区书法班微信群的线上观察和社会网络分析,以及对21位随迁老人的线下访谈,本研究发现趣缘群内的互动呈现为一种松散、稀疏的网络,具有广播式发言、符号化和仪式化三项特征;这一互动模式源于随迁老
学位
伴随着我国现代化建设的不断加快,人们越发的对居住环境和自然环境重视起来,因此未来实现可持续的战略发展,就要通过国土绿化的工作开展方式,营造出一个良好的社会发展环境。在该文的分析中,主要阐述当下乳源县国土的绿化推进以及实践的途径,以此为相关领域的工作人员提供一定的技术参考,全面推动该区域的建设和绿化环保工作,提升建设的整体力度。
期刊
学位
近年来,我国经济进入高速发展的快车道,但是高速发展的背后是沉重的环境代价,因此国家已将环境问题提升到了战略高度,动员社会各界加入环境保护的行列。2007年我国政府明确表示金融机构需要与环保部门合作,共同承担起改善环境的社会责任,因此对我国金融发展与环境污染之间的关系进行探讨具有十分重要的意义。本文通过对前人文献进行梳理,发现目前国内外对于金融发展与环境污染之间的关系尚未达成共识,在此基础上,本文从
学位
随着全球化时代的到来,各国间的文化传播交流活动愈发频繁。在我国,外来文化产品如韩综、美剧、日漫一直广受欢迎。在享受海外文化盛宴的同时,我们也需要推动本国文化产品走出去。“讲好中国故事,传播中国好声音”是习近平总书记提出的新时代使命,要想用故事向世界展现一个真实、立体、全面的中国,重点是要把“我们想讲的和国外受众想听的结合起来”。中国政府一向重视对美国民众的宣传工作,也曾多次在纽约时代广场播放国家形
学位
社交媒体在当下年轻人的生活中扮演着重要的角色,它不仅是沟通交流的主要渠道,也是年轻人表达自我的重要场域。在浪漫关系中,除关系双方需要不断交流沟通外,公开的关系状态展示也在浪漫关系建立和维持过程中越来越普遍。年轻人在技术赋能下愈加敢于“秀恩爱”,这种现象既是技术进步的结果,也是思想开放的必然现象。然而,技术进步不仅创造了表达空间,也带来了隐私风险。在浪漫关系中,如何平衡表露与隐私的关系,成为本研究关
学位
随着万物互联时代的来临,基于计算机视觉的人体动作识别研究已经成为当今一个重要的研究课题。传统的动作识别模型多数利用图像RGB数据、深度数据作为数据特征识别动作,但这些类型的数据通常含有大量外部噪音,使得模型的鲁棒性较差。近年来,应用图卷积网络对图结构数据进行分析的方法为计算机视觉领域提供了新的研究方向,而使用图卷积网络对人体3D骨骼点这一典型图结构数据进行建模和分析也成为了人体动作识别研究的新热点
学位
知识产权的转化发展和价值变现是当下的热点话题,在试点区域已经开始探索知识产权证券化的制度构建和产品打磨。著作权证券化作为知识产权证券化的开路先锋,有非常可观的经济价值有待挖掘。但因著作权本身自动生成无需登记的特点,造成证券化过程中的几大难点:一是权利无公示,转让、继承引起权利归属复杂的问题二是信息披露标准不清晰,一般资产证券化信息披露流程的可借鉴性低三是地方版权登记各自为政,对无形资产全国范围流动
学位
根据直肠脱垂患者的发病机制选择相应的治疗策略和治疗方法。直肠脱垂的主要治疗手段仍然是手术,但在中医治疗则以保守治疗为主。本研究旨在对直肠脱垂的外科治疗进展进行综述。根据临床经验,应根据直肠脱垂患者的病因、病情程度、年龄、病史和自身情况等综合评价为患者选取治疗方式,每一例患者都应该制定特定的治疗方案。年龄较小的患者有一定的自限性,大部分可自愈,谨慎选择手术治疗。年龄较大患者则应根据其自身情况进行充分
期刊