基于深度学习与深度强化学习的自动驾驶关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:sarah_zld
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能的不断发展,自动驾驶作为其重要落地项目也取得了巨大的进展。目前,自动驾驶主要由环境感知、行为决策与车辆通信三个方面组成。本文针对环境感知中的视觉辅助提出基于深度学习的实时语义分割算法,对行驶前进方向的街景图像做出实时语义分析;针对自动驾驶中的行为决策,提出使用深度强化学习的方法进行优化;针对车辆通信中提高车辆与路边单元通信效率方面,提出基于深度强化学习的方法,在车辆自动驾驶的情况下对路边单元进行智能主动缓存的联合优化。本文的主要工作和创新如下:
  1.针对使用卷积神经网络对街景图像进行语义分割时存在的计算量大、特征利用不充分的问题,提出了基于轻量多分支特征跨层融合的编码-解码语义分割网络结构。该结构分别使用不同分辨率的原始图像作为网络中多分支的输入,并在输入后,使用空间多用卷积核初步提取特征,之后使用残差模块进行后续的特征提取与特征融合,并在其中使用深度可分离卷积代替传统卷积以降低网络计算量。在网络的各个分支之间,进行各阶段的特征融合,并将分支结束后提取到的特征传递到下一分支中。经实验验证,该方法在Cityscapes数据集达到了112.3FPs的处理速度,并可以保证65.6%的mIoU语义分割性能。达到了进行实时语义分割的要求。
  2.针对自动驾驶的行为决策问题,采用马尔科夫决策过程进行建模,并提出基于深度强化学习的自动驾驶行为决策算法。首先将系统模型设定为单向直行三车道并包含多个干扰车辆的高速公路。将驾驶行为细分为:向左变道,向右变道,速度改为0 (停止),速度改为1,速度改为2,速度改为3。将车辆周围的状态作为其环境感知的结果,并设定为可以从系统模型中获取。然后针对不同状态、动作,设定相应的奖励值。提出了基于深度强化学习的自动驾驶行为决策算法。最后经实验验证,该方法在不同的学习率、干扰车辆数目等参数条件下,均取得较好的表现。
  3.针对车辆与路边单元通信效率的提升问题,提出在车辆自动驾驶的同时对路边单元进行主动缓存的优化方案。这时采用两个独立的马尔科夫决策过程对车辆与路边单元这两个对象分别进行建模。系统模型在上一方法的基础上,在道路侧方放置了多个路边单元,并使其可以均匀覆盖住车辆的行驶区域。车辆根据相应的无线信道模型计算出的接收数据包速率从路边单元中接收数据。路边单元根据车辆行驶速度、接收数据情况与上一路边单元的缓存情况决定缓存数据的数量。提出一种双DQN联合深度强化学习算法,来对两个不同的决策过程进行优化。经过实验验证,该方法在不同学习率、数据包需求量、路边单元距离等参数条件下,均取得较好的表现。
  本文最后分析了上述方法中的不足以及下一步的改进方向。
其他文献
近年来随着神经网络研究深度的增加,神经网络需要解决的场景越来越复杂,网络模型也随之变得复杂。复杂的模型使得预测过程的耗时逐渐变长,如何在保证原网络精度基本不变的前提下,对神经网络的预测过程进行加速是论文研究的重点内容。  论文主要研究了神经网络加速领域中的高效剪枝、低秩分解和硬件加速算法,并使用LeNet5、AlexNet、VGG11、VGG16等四种经典神经网络对上述加速算法进行实验验证。在此基
学位
近年来,随着材料技术、信息处理技术以及通信技术的发展,音视频会议系统已经克服了空间地理位置的限制,实现了人们远距离交互式的交流沟通。音视频会议系统可以让人们随时进行语音通话或者视频聊天,降低了沟通的成本,提高了办公效率。为了提高音视频会议系统的通话质量,使用自适应滤波器来消除回声信号对语音通话的影响。但是由于人们对音视频会议系统的通话性能要求越来越高,音视频会议系统中会配备多个麦克风设备和扬声器设
学位
随着无线通信技术的不断发展,电磁环境愈发复杂多变,传统的抗干扰方式缺少灵活性,无法动态地适应场景变化,高效可靠的智能抗干扰方案的研究势在必行。  本文设计了基于智能决策的抗干扰通信系统,将深度学习与强化学习算法应用到智能决策中,通过对传输环境的分析学习,完成信道与通信参数的智能选择,从而进一步提高系统的抗干扰能力。  首先对传统的抗干扰技术进行了概述,并对自适应抗干扰技术进行分析研究,指出上述方案
语音分离技术在语音信号处理系统及人工智能系统中有广泛应用。在实际环境下,传统的语音分离算法在低信噪比和高混响条件下存在泛化性能差等问题。本文结合人耳听觉感知特性,基于空间空间特征和谱特征,研究了基于深度神经网络的双耳语音分离方法。论文主要提出以下两种算法:基于前后帧信息的卷积神经网络CNN (Convolutional Neural Networks)双耳语音分离方法,基于语谱图和空间特征的深度聚
学位
尽管深度神经网络模型的性能出色,但随之而来的是急剧增长的计算力以及存储需求。模型压缩和加速技术研究的开展能够让深度模型更好地适应移动端设备。本文围绕基于模型剪枝的模型压缩和加速技术进行探讨,着力于在有效降低深度网络参数量的同时保证网络精度不明显下降。本文一方面结合迭代剪枝中的权重绝对值和对应变化量作为重要性判断依据进行剪枝,另一方面将剪枝框架和知识蒸馏结合以获得更好的压缩效果。本文的主要工作总结如
学位
调制识别一直是通信系统的一个重要研究领域。不论在军用领域的电子侦察、敌我识别还是民用领域的认知无线电等,调制识别都有重要应用,也是最为核心的技术之一。近几年随着5G的到来与AI技术的发展,调制识别技术的研究更加热门。目前调制识别多在高斯白噪声条件下研究,虽已取得了一定的研究成果,但距离实际应用还有较大的距离,这是因为通信设备所处的电磁环境日益复杂,形式多样的干扰无处不在,原有的调制识别方案大多对干
学位
情感识别在人机交互方面一直是一个极其重要的领域,涉及到了人工智能,情感计算等多个组成部分。语音往往能够直接的表达出人类的情感,因此如何提高语音情感识别的准确率一直是声学领域的热门研究课题。语音情感识别在生活中有着重要的意义,如机器自动识别儿童的情感并加以疏导或记录,以便家长能够更好的关注于儿童的心理健康;在公安局或监狱内,通过非接触式的识别被审问人的语音情感,能够更好的辅助警方发现嫌疑人的心理活动
语音分离技术作为语音信号处理系统前端,其分离的语音质量会直接影响到语音信号处理系统的性能。传统语音分离算法在高混响、低信噪比的环境下性能下降严重。本文在计算听觉场景分析CASA(Computational auditory scene analysis)框架下,结合麦克风阵列空间信息和深度神经网络,提出了两种语音分离算法:基于改进的相位变换加权可控响应功率 SRP-PHAT(Steered Res
学位
语音是人和人之间最重要的沟通媒介之一,在人机交互中也扮演着非常重要的角色,因此语音识别一直是人工智能领域的热门研究方向。传统的语音识别一般需要大量的有标注语音数据参与训练模型,才能使模型在测试数据上达到较高的准确率,进而达到应用在工业生产和日常生活的需求,而语音数据的采集和标注往往需要耗费大量的人力物力,训练过程也需要消耗大量计算资源,不仅如此,针对小语种和方言,标注数据的获取更为困难。为了应对这
学位
随着多媒体技术的迅速发展,包括图像、视频在内的视觉数据迅速增加,而这些海量的数据往往蕴含着大量有价值的信息,通过计算机视觉技术来分析这些信息可以让人类的生活更加便捷和安全。目标跟踪是计算机视觉领域中的经典任务之一,它旨在从任意一段视频中的一帧中指定一个物体,在后续的连续帧中推导出其位置。目标跟踪对于自动驾驶、安防系统等领域有着重大的应用价值。本文基于深度学习中的孪生网络对目标跟踪进行了深入研究,使
学位