基于雷达点云深度补全的运动目标识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chester116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第四次工业革命的到来,计算机和人工智能技术得到了快速的发展,以此为基础的无人驾驶作为新兴产业也得到了学术界以及产业界的大量关注。相较于传统驾驶模式,高性能的驾驶决策系统能够避免各种人因导致的交通事故,同时解放人类双手、缓解交通压力。精准灵敏的感知算法是无人驾驶车辆进行自主行驶的前提,目前主流的硬件冗余方案需要高昂的硬件成本,同时传感器的增多也会给数据同步和算法实时性带来很大挑战,因此研究低成本、抗干扰能力强的感知算法对于无人驾驶车辆的量产具有重要的意义。本文以无人驾驶的精准目标感知为研究目的,针对目前领域内亟待解决的感知问题例如:运动模糊、深度补全、3D目标检测等进行深入研究,探讨不同传感器的信息融合方式。本文的具体工作和成果如下:1)针对无人驾驶场景下由于车体抖动和相对运动所出现的摄像头采集图像运动模糊这一问题,本文提出了一种基于生成对抗网络的图像去模糊算法MobileNet-GAN。由于MobileNet中所采用的深度可分离卷积相对于传统卷积能够节省大量的计算资源,本文将其作为算法的骨干结构,同时为了降低整个模型的参数量,文中对于不同尺度下非线性层进行了权重共享,极大地降低了模型推理时间。算法在多个数据集上进行了性能比较,获得了较好的去模糊效果,同时网络的推理速度超越了其他比较算法,基本能够满足无人驾驶场景下的实时性初步要求。最后本文基于ResNet设计了 Mask-RCNN目标检测网络,验证了在不同模糊程度下本文去模糊算法对于目标检测效果的提高,证明了 MobileNet-GAN算法的实用价值。2)针对目前无人驾驶车辆使用的激光雷达线束较低导致点云信息较为稀疏的问题,本文提出了一种基于稀疏点云和对应帧彩色图像的多模态特征融合深度补全算法。针对部分卷积在处理稀疏点云时,距离较远的位置需要通过多层网络才能进行信息传播这一问题,本文在全局通道引入了门控卷积,用于获取更大区域内的特征依赖;针对点云深度补全网络推理时间较长的问题,本文使用ERFNet和堆叠沙漏模型进行表面法向量的预测以及局部通道的深度补全,极大地提高了模型的效率。通过对比实验,本文提出的算法在标准深度补全数据集KITTI上验证获得了较高的推理速度和精度。最后基于第二章提出的去模糊算法,本文设计了模糊容错深度补全框架,保证模型在运动模糊的情况下仍能保持较高的深度补全精度,提高后续算法的目标识别能力。3)针对现有的3D点云目标检测网络算法中存在的不足进行了深入研究,基于点云体素化操作提出了改进的雷达点云运动目标检测算法。原始算法中使用的最远点采样算法获取到的关键点存在一定的偶然性不能很好地对整个三维环境特征进行表征,本文通过引入空间注意力机制以及通道注意力机制更新关键点的特征信息,增强周围信息的依赖;针对关键点选取过程中会忽略局部区域上的特有结构信息从而导致小目标以及远距离目标检测的效果下降这一问题,本文在3D稀疏卷积之后引入了可变形卷积模块,用于提取更具有区分性的特征点信息,提高目标检测的效果。本文提出的检测算法在KITTI目标检测数据集上进行了效果验证,实验结果表明,在行人和自行车类别中,本文算法获得了最优的检测效果,同时对于车辆的检测也保持在较高水平。
其他文献
视频超分辨率是一种将低清视频流转换为高清视频流的图像处理技术。近年来,基于深度学习的视频超分辨率算法的重建指标已经超过了传统算法,但是这类算法的模型参数量通常较大,即使在高性能的服务器上也很难达到实时推理,导致算法难以在实际场景中得到广泛应用。为了降低视频超分辨率算法的模型参数量、加快网络的前向推理速度,本文对实时的视频超分辨率算法展开研究,主要内容如下:(1)为了解决参数量小的算法无法有效应对视
无人车的定位问题是无人驾驶中的关键技术,是当下的研究热点。传统的定位方法,例如GPS、惯导在城市环境下难以满足高精度的定位需求,视觉定位因为传感器体积小、成本低,定位精度高的特点在定位问题中越来越受到重视。视觉里程计是视觉定位中的一种经典方法,但其作为一种航位推算算法,需要给定一个确定的起始位姿,并且它不可避免地存在累积误差。在城市环境中,车载传感器通常无法提供一个准确的起始位姿,在长距离定位中视
目标检测可以为图像理解提供分类与定位信息,有较强的应用价值,被广泛应用于自动驾驶、遥感图像探测等任务中。随着深度学习与神经网络近年来的发展,基于深度神经网络的目标检测方法取得了重大进展。全监督目标检测方法的发展非常依赖大规模精确标注数据集,而边框级的标注费时费力,成本高昂,因此弱监督目标检测方法逐渐受到关注,其仅需要图像级标签,大大降低了训练数据集的标注成本。本文的研究内容为仅有图像级标签的弱监督
随着移动互联网的发展,手机等智能移动终端已经融入人们的日常生活。人们在使用移动互联网服务的同时产生了大量的数据。其中,位置数据有着很高的利用价值,它可以用来挖掘人口的空间特性,计算区域人群密度,为公共安全事件预警、交通监测以及区域规划等提供帮助;还可以用来判断个体接触,为排查传染病密切接触者提供数据支持。位置数据获取的基础是终端定位,在室外可以通过GPS技术获取位置信息,但是在高楼下或是室内环境中
大数据时代下,现有的计算结构在面对数据密集型的应用时,会因为大量的数据搬运和带宽的限制带来能耗和延迟上的提高。为了解决访存和数据搬运造成的能耗和延迟,学界提出了基于SRAM的算术逻辑运算电路,在存储器中实现算术逻辑运算。现有基于SRAM的算术逻辑运算电路因为计算模式比较单一,在面对外界输入和存储单元之间运算的场景时,电路的性能会受到限制。本论文提出了一种新的基于SRAM的多模式算术逻辑运算电路结构
近年来,随着移动互联网和物联网技术的快速发展,基于室内位置信息服务的需求随之而出现爆发式增长,室内定位技术也越来越受到关注。以智能手机为代表的智能移动终端设备,内部集成可以感知各类环境信息的惯导、地磁、无线、红外、声音等多种传感器模块,已成为实现室内定位功能的重要媒介。其中,随着声传感器采集性能的提升,人耳听不见但可以被移动设备识别的近超声频段成为研究热点,在室内声学定位系统发挥着重要作用。目前,
情绪是人在特定的场景刺激下产生的心理和生理的协调反应,与人的心理状态和生理健康息息相关。负性情绪会严重影响工作效率与工作质量,也会干扰判断、决策等高层次认知过程。因此对情绪状态进行客观准确的识别和分析具有重要的实际应用价值。目前常用的情绪识别方法有观察表情动作法和量表自我评估法。这两种方法虽然简单有效,但都较为主观且具有滞后性。人的情绪活动受到自主神经系统和中枢神经系统的调控,以及人脑高级认知的调
睡眠相关疾病严重影响着人们的健康,多导睡眠监护是目前诊断睡眠疾病的主要手段。现有多导睡眠监护系统的自动诊断准确率较低,诊断过程仍主要依赖专家人工操作,耗时耗力。因此,研发适合临床应用的高准确度的多导睡眠智能分析算法具有重要意义。本文基于脑电、肌电与眼电信号,实现了睡眠监测系统分期算法,主要研究内容如下:1.分析了脑电、肌电和眼电三种生理信号与睡眠阶段的关系,分别提取了相关性较强的时域、频域和非线性
随着车联网的发展,车联网提供的服务逐渐多样化,给人们的生活带来了诸多便利。车辆在获取基于位置的服务(Location-Based Services,LBS)时,需要提供其真实位置,而位置信息暗含了车辆用户的个人隐私信息。如果位置信息提供给不可信的LBS服务器,将造成车辆用户的隐私泄露问题。因此,本论文研究车联网中的位置隐私保护问题,着重研究车辆用户位置与轨迹的隐私保护方法。针对服务质量与隐私保护间
日益增长的高速实时流数据传输需求对系统带宽、时延以及稳定性都带来了很大的挑战,与此同时通用处理器也逐渐成为高性能数据传输领域的瓶颈。针对此现象,本文对高性能实时信号通道技术展开研究,提出并设计了一种面向嵌入式系统的高性能实时数据传输分发系统架构。该系统融合了基于Aurora的模块间串行数据传输和基于万兆以太网TCP/IP卸载引擎技术的处理模块与服务器互联,在高性能实时流数据传输领域具有较好的应用价