极限工况下自动驾驶车辆的轨迹规划与运动控制

来源 :清华大学 | 被引量 : 5次 | 上传用户:kingwill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的底盘控制系统主要通过分配各车轮制动力与驱动力防止车轮抱死或打滑,以维持车身稳定性。但在专业驾驶比赛中,驾驶员会通过有意识地控制车轮抱死或打滑完成漂移等极限驾驶策略,以减小圈时或躲避障碍物。当前底盘控制系统受限于传统车辆感知范围的局限性,控制算法仅基于自车状态信息,无法利用周围环境的道路、障碍物等信息。因此,通过研究极限工况下的车辆动力学特性和控制策略,可以指导下一代自动驾驶车辆底盘控制系统的设计,扩展其控制边界。本文针对不同的极限驾驶工况,提出了稳态漂移工况的平衡态稳定控制方法、极限和非极限混合工况的轨迹规划和运动控制方法以及基于人工智能强化学习的车辆极限工况控制方法。首先,提出了考虑有限控制能力和模型不确定性的稳态漂移控制方法。建立稳态漂移工况下的车辆动力学模型和考虑附着圆限制的非线性轮胎模型,分析稳态漂移工况的动力学产生机理。基于线性二次型算法设计前馈与反馈相结合的稳态漂移控制器,针对稳态漂移工况下轮胎附着力接近饱和导致的有限控制能力和路面附着系数变化导致的模型有界不确定性,设计了系统的最大吸引域和稳态漂移状态不变集,保证系统状态处于吸引域内时可以收敛于不变集。其次,提出了适用于极限和非极限混合工况的轨迹规划和运动控制方法。轨迹规划算法将可行驶区域分为不同类型,在极限工况下采用基于规则和随机采样算法规划期望轨迹,在非极限工况采用结合车辆动力学模型的快速扩展随机树算法规划期望轨迹。运动控制算法基于单轨车辆模型和线性轮胎模型,采用开闭环相结合的控制策略,利用模型预测算法设计控制模式的切换策略,实现漂移参考轨迹的跟踪。然后,提出了极限工况下结合先验知识的强化学习算法。基于Actor-Critic强化学习框架,设计了反映系统控制律的行为网络和评估控制律优劣的评价网络,通过策略梯度算法和时序差分算法更新行为网络和评价网络。强化学习算法分别以人工演示和最优控制算法为先验知识,有助于行为网络和评价网络收敛至全局最优,经过训练的神经网络达到了专业驾驶员在极限工况下的操控能力。最后,搭建了1:10比例的实车平台,完成了稳态漂移和瞬态漂移实车实验。实验结果表明了本文提出的极限工况下轨迹规划和运动控制算法的可行性。
其他文献
高斯白噪声生成是用于卫星地面测试的卫星遥测信号模拟源的一个功能模块。高斯白噪声生成分两步实现。介绍这两步中的主流算法,并对其性能进行了分析;采用了满足卫星遥测信号
目的探讨腹腔镜全腹膜外疝修补术治疗成人腹股沟疝的临床疗效。方法回顾性分析48例成人腹股沟疝患者的临床资料,所有患者均在腹腔镜下行全腹膜外疝修补术(TEP)治疗,观察临床
肿瘤是威胁人类健康的主要因素之一,癌症是由于肿瘤恶化引起的。目前对于肿瘤的检测方法主要包括活组织切片法、核磁共振法和CT法。但是这些方法都对于人体有一定的损伤,而且
成都市虽然凭借优越的地理和自然生态环境条件,成为中国的优秀旅游城市和休闲城市,但是成都市在受到城市化的冲击过程中,需要解决城市化带来的一系列环境、社会、经济等问题,
西藏多龙矿集区是我国在藏西北班公湖–怒江成矿带西段发现的超大型铜(金)矿集区,目前已探明铜金属资源量超过2000万吨,伴生金金属资源量超过420吨,在东西长约47 km,南北宽约
<正>习近平总书记在参加黑龙江代表团审议时指出,党中央对于东北地区振兴态度很鲜明,一是要继续大力支持,二是要激发内生动力。我们感到,龙江实现振兴发展必须依靠全面深化改
期刊
本文提出了互联网电子商务概念的四个层次:通过互联网销售实物商品、通过互联网销售虚拟商品或数字商品、通过互联网提供和销售服务、通过互联网创造和提供价值,然后说明了提
信托型资产证券化在我国是一种全新的金融创新工具,与其相关的信托法、证券法尚未为其预留应有的法律空间,指导实践操作的法律文件效力低、条文规定不具体,依据这样的法律规
液晶显示作为当前主流的显示器件,已经在航空航天、家用电器、通讯设备等等领域得到越来越广泛的应用,和人们的生活息息相关,密不可分。随着平板显示技术的不断发展,人们对于
保障性住房政策主要由廉租住房政策、公共租赁住房政策和经济适用住房政策组成,其主要功能是解决中低收入阶层的住房难题和抑制城市房价过快上涨等。近年来中央出台多项政策