城市环境下的无人驾驶汽车换道决策研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:www4006804680com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶技术在汽车领域一直都是未来的一个重要发展方向,并且随着人工智能技术的高速发展,使无人驾驶的实现更近了一步。目前,无人驾驶决策是无人驾驶技术最需要突破的问题之一,尤其是在复杂未知的城市道路上进行驾驶决策,所以,针对这一问题需要采用一种能够自主学习并且在复杂多变的行驶环境下都能做出安全合理的决策方法,而根据深度强化学习具有自主学习能力和强泛化能力的特点,因此,本文采用深度强化学习的方法来研究城市环境下的换道驾驶决策问题。本文以深度确定性策略梯度算法(DDPG)为基础,针对原始的DDPG算法在动作探索中存在大量盲目的探索和重要样本数据利用率低导致学习到的换道驾驶策略差、学习速度慢等问题,在原有算法的基础上设计出了一种基于专家指导的深度确定性策略梯度算法(DDPGWEG)。首先,增加了对行动者网络输出动作的指导,它是通过专家网络得到专家动作来同时指导行动者网络的输出动作和评论者网络参数的更新过程,使行动者网络的输出动作更有方向性,能够减少训练初期盲目的动作探索,间接的提高了样本数据的质量。其次,加入了经验分类的优先回放技术,经验分类的优先回放是设计了两个回放池,通过奖励值的高低来将样本划分到两个池中,然后在初始训练阶段,在高质量的回放池中采集样本,等高奖励值的样本多于低奖励值的样本,再按照TD-error排序的优先级采样的方式从两个回放池中各采集一半的样本,提高了高奖励样本利用的同时又增加了采集样本的多样性,从而提高自动驾驶汽车学习到的驾驶策略的质量,使自动驾驶汽车能够通过这一算法来完成合理的决策。最后,通过分析城市道路的特点及车辆换道的特点完成了DDPGWEG算法的各个部分的设计,仿真实验部分采用TORCS仿真平台作为实验平台,实现了换道驾驶决策的仿真实验,实验结果表明,相比于原始的DDPG算法,DDPGWEG算法在学习到的换道驾驶策略优劣程度与车辆换道的安全和行驶效率上都有所提升,算法也有较强的泛化性,能够完成换道驾驶任务,验证了改进算法在换道驾驶任务上能够安全合理地做出决策。
其他文献
学位
新型纳米复合材料具有高电导率、良好的化学稳定性和结构稳定性等优点,将之用于制备高性能修饰电极,对于检测重金属离子具有重要的意义。本文结合碳纳米管(MWCNT)和聚(3,4-乙烯二氧噻吩):聚苯乙烯磺酸(PEDOT:PSS)的高电导率和良好的分散性等优良特性,采用化学氧化聚合法制备了碳纳米管/导电聚合物复合材料,研究了碳纳米管的含量对复合物的分散性、电导率、修饰电极的电化学性能的影响。为了提高复合物
近年来随自媒体的快速发展,极大的带动了网络舆论的传播和发酵速度,尤其是一些社会热点事件会在短时间内通过互联网平台形成快速传播效应,这对于地方政府的网络舆情应对能力也提出了更高的要求。然而在面对一些社会热点事件所引发的网络舆情时,很多地方政府并没有树立起科学的观念意识,对于这种网络舆情的影响缺乏足够重视,并且在处理过程中也存在着一些处理方式不当的问题。这不但会导致网络舆情的进一步发酵,还会对地方政府
在攀钢高炉冶炼过程中,高价值的钛、钪等共生金属元素绝大部分进入渣相,形成含TiO2约24%的含钛高炉渣。攀钢含钛高炉渣是宝贵的二次资源,由于矿物相复杂,难以有效利用。针对攀钢含钛高炉渣利用难题,虽然许多学者进行了大量研究,甚至已建立了一些示范性产业化路线,但由于资源、环境及社会经济效益等多因素制约,目前距离有效解决含钛高炉渣高值资源化利用尚有很大差距。形成这种含钛高炉渣高值资源化利用困境的本质原因
目的:发展以牛羊为主的生态畜牧业,为当前我省12大优势特色产业之一。紫云县素有养殖黑山羊的传统。为摸清该县黑山羊消化道寄生虫感染状况,提出有效防制措施,降低疾病因素造成的经济损失,而开展本调查研究。方法:采集114份新鲜黑山羊粪便样品,通过传统的和新型的消化道寄生虫虫卵检查法,检出虫卵并进行鉴别判读,获得当前紫云县黑山羊消化道寄生虫主要感染种类、感染强度和优势虫种。结果:(1)114份粪便样品中,
基因组编辑技术的出现是各物种基因组测序逐步完成破译的必然结果。在这一探索与揭秘的过程中,更新了以ZFNs,TALEN,CRISPR/Cas系统为主的三代人工核酸酶基因编辑技术,无论是对普通细胞系,还是生命个体,在基因功能研究,新技术的开发,转基因作物与动物生产,人类基因组遗传病治疗等各方面均发挥了极大的推动作用。真核细胞基因组的复杂性,活体细胞环境的多样性,DSBs产生的潜在危害性均是基因组编辑难
我国领海面积广阔,占我国总领土面积的三分之一,且海面邻国较多。近年来,海上安全形势日趋复杂,别国窥视我国海洋资源,各国船只不断侵入我国领海;海上军事争端越演越烈,确保海域安全是我国现在以及今后军事战略的重点;因此,加强对我国海域的监控和对入侵舰船的实时探测是非常重要地任务。然而,传统舰船目标检测方法由于仅仅挖掘利用了目标的底层或浅层信息,导致舰船目标检测性能有限;因而需要进一步研究稳健的舰船目标检
目的:胆汁酸(bile acid,BA)作为一种多功能的信号分子,具有调节脂质、葡萄糖和能量代谢,是维持机体正常生理功能的重要物质。胆汁酸具有高效的肝肠循环特征,主要包括肝脏,胆囊,小肠,结肠和血浆五个部分组成。胆汁酸肝肠循环是维持机体胆酸稳态的关键因素,在正常生理状况下,胆汁酸肝肠维持恒定。然而,机体在药物和酒精等外源性物质的作用下会造成胆汁淤积,从而引发多中肝胆疾病。酒精性肝病患者时常伴有黄疸
学位
组合导航技术是应用于移动机器人系统中,能保证机器人完成精准导航的一种重要技术。现有的研究中采用了多种方法来提高移动机器人GPS/INS组合导航的精度。然而,这些研究都忽视了机器人导航系统在复杂地带工作时,受到不确定噪声干扰的问题。同时,也忽视了移动机器人的GPS精度易受众多因素的干扰,导致数据传输出现时滞的现象。针对以上问题,本文以Summit-XL机器人为对象,研究了组合导航方法的鲁棒H∞滤波问