【摘 要】
:
随着人工智能技术的快速发展以及智能汽车应用需求的日益增长,车辆智能驾驶技术已成为当前的研究热点。智能驾驶关键技术包括环境感知、行为决策、路径规划、运动控制等,其中行为决策与运动控制技术是衡量智能驾驶车辆自主能力的关键指标,也是智能驾驶研究的重点和难点。目前,智能车辆环境感知技术已经取得了大量的研究成果,但车辆行为决策与运动控制方法仍较依赖人工先验知识来设计专家规则或模型,对复杂环境适应性不强。在动
论文部分内容阅读
随着人工智能技术的快速发展以及智能汽车应用需求的日益增长,车辆智能驾驶技术已成为当前的研究热点。智能驾驶关键技术包括环境感知、行为决策、路径规划、运动控制等,其中行为决策与运动控制技术是衡量智能驾驶车辆自主能力的关键指标,也是智能驾驶研究的重点和难点。目前,智能车辆环境感知技术已经取得了大量的研究成果,但车辆行为决策与运动控制方法仍较依赖人工先验知识来设计专家规则或模型,对复杂环境适应性不强。在动态复杂的城市驾驶环境下,传统行为决策与运动控制方法面临更多的挑战。当前,为克服已有方法自动化程度不高和过于依赖人工经验等问题,将模仿学习和强化学习等机器学习技术应用于智能驾驶行为决策与运动控制已成为一个重要的发展趋势。其中,模仿学习可以把人类驾驶员丰富的经验数据建模学习为具有良好性能的行为决策或运动控制模型,从而有效解决传统行为决策与运动控制方法依赖人工先验知识的问题,同时也能避免强化学习需要过多试错训练且收敛困难的缺点。模仿学习中最常用的为有监督的策略函数回归方法(如行为克隆),同时也包括逆强化学习和直接策略交互学习方法。有监督的策略回归与一般的监督回归方法不同,它是在一个连续动作且具有时序决策特性的策略空间上进行回归和建模,要获得良好的性能还需要克服特征的高效抽取、时序回归模型的迭代优化等难题,因此,现有的模仿学习方法在学习精度和泛化性能等方面还存在不足。本文主要针对以上问题开展基于模仿学习的智能车辆行为决策与运动控制方法研究,因此,在理论和应用上都具有重要的意义。本文主要研究工作和创新点如下:(1)提出了一种基于Bagging高斯过程回归(Bagging Gaussian Process Regression,Bagging GPR)的驾驶行为建模方法。该方法既利用了高斯过程回归方法基于贝叶斯推理和核函数映射的高效性学习特点,同时也利用了集成学习Bagging方法采用多个模型并行训练和集成策略的优点来进一步提高驾驶行为建模的学习精度。通过在自动驾驶高级仿真平台Pre Scan上分别搭建道路跟随、直道超车和弯道避障三种典型驾驶场景,对提出方法进行性能评测。结果表明,与多层神经网络反向传播、集成回归树、支持向量回归和高斯过程回归等其它基于机器学习的驾驶行为建模方法相比,提出的基于Bagging高斯过程回归的驾驶行为建模方法能进一步减小模仿学习误差,提高模型的泛化性能。(2)针对端到端行为模仿学习中卷积神经网络(CNN)存在全连接层泛化能力有限和容易收敛至局部最优的问题,提出了一种驾驶行为模仿学习的卷积神经网络高斯过程回归(CNN-GPR)方法,并设计了Pilot Net-GPR和Res Net-GPR两种算法。该方法使用全局映射能力和泛化性更强的高斯过程回归改进端到端CNN网络的全连接层结构,完成CNN提取特征到驾驶行为的高效学习。在百度Apollo端到端自动驾驶数据集上的实验表明,设计的Pilot Net-GPR和Res Net-GPR算法相较于基于Pilot Net和Res Net网络的方法能进一步提高端到端驾驶行为模仿精度和网络模型的泛化性能。特别地,与英伟达设计的Pilot Net网络相比,提出的Res Net-GPR方法在测试集上的均方误差(MSE)减少了16.27%,平均绝对误差(MAE)减少了9%。(3)提出了一种时序图像驾驶行为学习的深度神经网络高斯过程回归(CNN-LSTM-GPR)方法,进一步利用时序信息提高驾驶行为学习精度。该方法使用高斯过程回归改进级联深度神经网络(CNN-LSTM)的全连接层结构,对级联深度神经网络提取的特征到驾驶行为之间的映射进行更高效的学习逼近。在百度Apollo端到端自动驾驶数据集上的实验结果表明,在同等条件下与基于单幅图像的端到端模仿学习方法相比,CNN-LSTM-GPR方法能考虑更多的时序信息,模仿误差更低。与CNN-LSTM方法相比,CNN-LSTM-GPR方法能进一步提高时序图像到驾驶行为动作的映射学习精度,算法泛化性能更优。(4)使用实验室搭建的自主车平台对驾驶行为学习的CNN-GPR方法和CNN-LSTM-GPR方法进行测试和验证。在红旗E-HS3自主车平台上搭建了数据采集模块并采集了城市道路驾驶行为数据集,接着在采集的实车数据集上对提出方法进行性能评测,进一步验证了驾驶行为学习的CNN-GPR方法和CNN-LSTM-GPR方法的有效性。
其他文献
湿度是表示湿空气中水汽含量多少的物理量,湿度测量是地面及高空气象观测的重要内容之一。湿度测量的方法和仪器较多,基于图像识别法的显微成像式露点型湿度传感器能准确测量湿度,本文主要从以下三个方面对露点型湿度传感器进行性能优化研究:从测量性能研究上出发,除了开尔文和拉乌尔效应外,还分析了其他影响露点型湿度传感器测量性能的因素,包括露点型湿度传感器使用过程的把控和镜面凝结与消散过程时机的判断。从镜面凝结状
计算机、手机等智能设备在给人们带来便利的同时,也带来很多安全问题。传统的观点认为物理隔离环境下的系统相对安全,但随着技术的发展,这种防护方式也面临着新的威胁。作为信息隐藏技术的重要部分,音频隐写技术近几年发展迅速,同时声学隐蔽通道是突破物理隔离的一种重要方式,因此研究物理隔离环境下基于音频的隐蔽通信方法具有重要的意义。本文以物理隔离环境为背景,以音频隐写为主要研究对象,从隐蔽通信的实际应用角度出发
端点拥塞是高性能计算(HPC)互连网络的瓶颈,并严重影响系统性能,尤其是对延迟敏感的应用程序来说。对于持续时间远远大于网络往返时间(RTT)的长消息(或流),网络可以通过主动或被动的拥塞控制机制将每个源的注入速率动态控制为适当的水平,从而有效地减轻端点拥塞。但是,许多HPC应用程序产生混合流量,即短消息和长消息的混合,并且由短消息在数量上占主导,但长消息的总量很大。要调度由这些短消息引起的快速变化
教学质量评价工作是教育评估的一项重要工作。本论文针对目前教学质量评价缺乏统一全面的评价方案的现状,在全面分析教学活动各要素的基础上,构建了一种多视角复合型教学质量评价体系,提出了基于多种现代评价方法的教学质量评价方案,详细设计了各个环节的评价指标体系和评价方法,并在Excel中实现了各个评价环节的计算,制作了各个评价环节的评价计算表,验证了本文提出的评价方案的合理性和可行性,并开发了基于Web的学
近年来,随着生活水平的提高和交通的快速发展,世界人口的指数增长和随之而来的城市化导致人群聚集得更加频繁。在这种情况下,人群密度分析的问题对于在人群监视和场景理解等拥挤场景中建立更高水平的认知能力至关重要,在公共安全领域意义重大。人群密度分析旨在对拥挤场景中的人数进行分析,计算总人数和密度估计,其中密度估计旨在将输入的人群图像映射到其对应的人群密度图。但像其他任何计算机视觉问题一样,人群密度分析也面
多智能体编队控制是指多个智能体在向目标机动的过程中,形成并保持某种特定构型,同时能够躲避障碍以适应环境约束的控制技术,在工业、军事、航天等众多领域有着重要的应用价值。本文以此为研究背景,开展了相对位置约束型编队机动控制方法设计、相对方位约束型编队机动控制方法设计、智能体之间的碰撞规避以及编队控制建模与仿真分析等问题的研究,取得的主要成果如下:相对位置约束型编队机动控制方法设计。假设各跟随智能体能够
漏洞是危害计算机系统安全的主要因素之一,程序漏洞的自动检测具有非常重要的研究意义,也是一个非常具有挑战的研究问题。通常,漏洞检测需要分析不完整的程序(Partial Program),而传统基于规则的静态漏洞检测方法和工具在分析不完整程序上具有较高的漏报率和误报率。机器学习(特别是深度学习)为不完整程序漏洞检测提供了新的思路,但已有方法在真实程序上的效果仍然有待验证。我们提出了基于图神经网络的不完
近年来,伴随着大数据的兴起,大规模正则化经验风险极小化问题出现在各个领域中。作为一种求解此类大规模问题的途径,临近增量累积梯度方法(PIAG)得到了研究者的广泛关注。临近增量累积梯度方法可对应多种具体的算法实现,包括循环指标、随机指标、中心分布式等,因而有着广泛的应用前景。本文对PIAG将会涉及的研究工作进行了系统的设想和构建,从非精确算法、Bregman距离、加速格式、非凸分析、对偶算法、原对偶
惯性导航是一种自主导航方式,可以不依赖于任何外部信息支持而独立的完成导航任务,在军用与民用领域都有着广泛应用。加速度计与陀螺仪是惯性导航的核心器件。本文在对比分析了传统加速度计的优缺点基础上,针对基于双光纤光阱的光力加速度传感系统展开了初步的理论与实验研究。简单回顾了惯性导航技术的发展历程,比较了不同种类加速度计的原理和优缺点,重点分析了光力加速度传感技术的原理优势与前沿进展,指出了其高精度、小型
近年来,随着新媒体信息技术的飞速进步和传播手段的多样发展,各国国防部网站不断发展完善,网站面貌更迭焕新,但官方网站的权威属性和价值传播的实战效能始终位于核心增长点。作为最早建立的国防部门户网站,美国国防部网站几经改版,成为当今国际社会最具代表性的国防部网站之一,其重要功能之一是发布兼备机构话语、新闻话语、国防话语、军事话语的语类特征的军事新闻报道。这些报道表现出以网页为载体的多模态文本的形式特征,