基于稀疏卷积特征增强的三维目标检测

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:naimiu2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维目标检测作为计算机视觉领域中重要的一部分,它在很多领域中起到了重要的作用,例如自动驾驶和智能机器人等领域。近些年,随着研究的不断深入,多个公开的三维目标检测数据集被提出,促进了三维目标检测技术的发展进步。基于三维视锥的方法是三维目标检测任务中一种具有代表性的方法,其通过二维目标检测框获取三维视锥点云数据,缩小了三维搜索空间。然而当前基于视锥的方法仍然存在特征提取能力不足和难以处理一个视锥中存在多个物体的问题,因此,本文主要从以下两个方面进行了改进:(1)本文提出了基于稀疏卷积的视锥三维目标检测算法。该算法采用了基于视锥的方法,缩小了三维目标检测的搜索空间,因此降低了网络训练的难度;同时该算法采用了稀疏卷积神经网络来提取视锥点云特征,增强了基于视锥的方法的特征提取能力,避免了对点云进行稠密体素化所带来的额外计算与存储开销。(2)本文提出了一种基于稀疏特征增强的视锥三维目标检测算法。考虑到同一个视锥中存在多个物体时会影响检测性能,本文设计了一种针对稀疏特征的感兴趣区域特征增强模块,用于加强视锥中前景物体的特征,降低其他物体对检测器的干扰;同时本文采用通道特征增强模块,根据网络输入特征自适应地调整各个通道的权重,提升了网络特征表达能力,使网络更易区分同一视锥中存在的不同物体。通过结合感兴趣区域特征增强模块以及通道特征增强模块,本文对视锥的稀疏特征进行了特征增强,使网络提取到了更具表达能力的特征,增强了网络的检测性能与鲁棒性。本文对基于视锥点云的三维目标检测任务进行了研究,并针对基于视锥的方法所存在的问题,提出了一种基于稀疏卷积特征增强的视锥三维目标检测算法。本文在两个公开的室外场景三维目标检测数据集中进行了实验验证,基于上述两个方面的改进,本文方法取得了有竞争力的检测性能,同时在推理速度与检测性能上取得了平衡,证明了本文方法的有效性。
其他文献
激光遥感具有空间分辨率率高、测量范围大、穿透性强的优势在海洋遥感中有着越来越重要的价值。其中,基于布里渊散射的激光雷达能够实现海洋次表层温盐遥感而受到广泛关注。在现有的布里渊激光雷达技术中,基于多边缘技术的测量方式具备大规模遥感海洋温盐垂直剖面分布的能力。目前该测量方法已经完成了理论构建和仿真实验分析,本文的目的是进一步推进该方法从理论向实际应用的发展。为了将该布里渊温盐测量理论推进到实际应用阶段
学位
红外弱小目标检测是红外搜索与跟踪等系统的关键技术,对于提升未来战争中的预警、制空和反击等能力具有重要的价值。通常由于探测距离远和成像环境复杂,目标具有尺寸小、特征少和信噪比低等特点,给其检测带来了不小的困难。目前,基于低秩稀疏的红外弱小目标检测算法具有良好的检测性能,但也存在对局部和非局部特征利用不充分以及对背景低秩逼近不准确的不足,其场景泛化以及抗噪声和稀疏干扰能力仍有待提升。本文分析了不同场景
学位
5G网络建设成本高昂,70%的成本投入在无线接入网。传统无线接入网,采用封闭式系统架构设计,极大推高了建网费用。开放式无线接入网(Open Radio Access Network,O-RAN)旨在打破设备商的垄断,降低接入网的建设成本。网络切片技术是5G的关键性技术,通过在实际的物理网络上切分出多个逻辑网络,来满足不同业务对网络的需求。目前O-RAN网络架构及协议仍处在演进过程中,面向异构流量传
学位
智慧交通是未来城市的必然发展趋势,交通拥堵作为制约社会发展的重要因素之一,是智慧交通中亟需解决的问题。对交通信号进行智能控制能有效缓解交通拥堵。近几年,基于深度强化学习的智能交通信号控制研究受到了学术界和工业界的热切关注,但同时也面临使用单一数据进行训练导致的学习效率低、模型鲁棒性差等问题。因此,本文基于联邦强化学习方法开展跨域智能交通信号控制算法研究。首先,本文提出了一种基于联邦强化学习的跨域智
学位
现代移动通信要求支持的终端移动速度越来越大,信道呈现快速时变的特性,导致基站获取的信道状态信息快速过期。信道预测根据历史的信道状态信息预测当前时刻的信道状态信息。时间卷积网络(Temporal Convolutional Network,TCN)采用扩张因果卷积结构,具备感受野灵活,梯度稳定等优点,本文首次提出将TCN网络用于时域信道预测问题,并且进一步提出了复数域的时间卷积网络(Complex-
学位
驾驶员处于疲劳状态时判断力和反应能力明显下降,极易引发交通事故,对道路交通安全造成极大威胁。在驾驶过程中实时监测驾驶员状态并及时预警,可以有效保障行车安全。现有基于深度学习的疲劳检测算法大多倾向于通过不断增加网络深度和复杂度来达到更高的准确率,从而导致算法实时性欠佳,且模型无法直接部署至计算资源受限的移动端、嵌入式设备上。本文面向实际驾驶场景,研究基于面部特征的实时疲劳驾驶检测算法,并针对算法部署
学位
在计算机视觉领域中,多目标跟踪是一个非常重要的研究课题,其目的是得到视频中感兴趣物体的运动轨迹,包括每帧中代表物体位置信息的包围框和代表物体身份信息的编号。多目标跟踪有广泛的应用价值,是安防监控、自动驾驶、智慧城市等应用中的关键技术。多目标跟踪中包含目标检测、行人重识别等其他研究方向的技术,其中,目标检测常用来获取目标位置,行人重识别常用来得到目标的身份。多目标跟踪大多对行人进行跟踪,场景较为复杂
学位
三维点云分析是计算机视觉中的一个重要任务,其在人们的生产生活中有着极为广泛的应用,如自动驾驶,遥感制图,增强现实等。近年来,随着深度学习技术的不断进步,三维点云分析领域也取得了重大的突破。相较于传统的手工设计的三维点云分析算法而言,基于深度学习的三维点云分析方法在多个公开的数据集上都取得了更为显著的结果。在三维点云分析任务当中,提取有效的局部区域特征描述子以及充分挖掘各个局部区域之间的相关关系都是
学位
手写数学公式识别是文档分析领域中的一个非常重要的任务,在自动阅卷、数字图书馆、办公自动化等领域有广泛应用。近年来,随着深度学习的广泛应用,手写数学公式识别研究取得了快速的发展,尤其是注意力机制的引入大幅度提升了公式识别精度。但是大部分现有的基于注意力机制的手写数学公式识别算法在处理较长或者空间结构较复杂的数学公式的时候,依然存在一定的困难,容易出现注意力不准确的情况,从而导致漏掉符号、预测出重复或
学位
基于Wi-Fi指纹的室内定位技术在近些年得到了广泛地研究,主要集中于研究如何在独立模式下提高定位精度。有少量研究提出利用额外硬件设备进行用户间距离测量用以提升定位精度,但这增加了成本,限制了实用性。为解决这一问题,本文提出了一种隐式协同定位新模式,旨在挖掘同一区域多个用户的Wi-Fi信息来改进用户群体定位性能。本文对此类隐式协同定位进行了深入研究,提出了以下三种方法:(1)基于用户互距离估计的协同
学位