面向结构化三维场景的语义分割算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:HHP110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构化三维场景的语义分割是多种计算机视觉任务的基础,在场景分析、人机交互、增强现实、自动驾驶等领域具有重要意义。近年来,虽然基于深度学习的结构化三维场景语义分割的性能有所提升,但是在预测精度、计算复杂度、标签依赖性等方面还存在许多问题。本文分别基于双目相机采集的三维场景数据,和激光雷达、Kinect等传感器采集的三维点云数据,展开了面向结构化三维场景的语义分割算法的研究。基于双目相机系统,本文利用颜色、纹理、几何和视差信息,提出了一个鲁棒的路沿描述子来刻画路沿区域特征,从而提升路沿分割的精确度,并进一步提出了基于路沿分割的道路和人行道分割模型。基于激光雷达、Kinect等传感器采集到的三维点云数据,本文引入深度学习技术,进一步提升结构化三维场景语义分割精度。针对三维点云语义标注代价高昂的问题,本文提出了结构化场景三维点云的半监督语义分割模型。此外,针对实际应用中分割模型泛化能力差的问题,本文进一步提出了基于三维点云的无监督跨域自适应语义分割模型。本文的主要研究内容包括:(1)针对结构化道路场景中的小目标——路沿的分割问题,本文提出了基于双目相机的路沿分割方法,并基于路沿分割进一步提出了道路和人行道分割方法。通过融合颜色、纹理、几何、视差多种信息,本文提出了一个具有判别力的路沿描述子,帮助模型更好地完成路沿的分割。在路沿分割的基础上,本文构建了代价图,并基于代价图寻找由道路消失点到图像底端的最短路径,利用路沿信息增强对道路边缘的检测从而提升道路区域的分割结果。基于道路区域的分割结果和三维场景的几何特征,通过筛选人行道区域的种子点,并利用区域增广策略,本文实现对人行道区域的分割。实验表明,本文提出的方法在路沿、道路和人行道区域的分割上均取得了良好的分割结果。(2)针对三维点云中大范围上下文信息的传播问题,本文通过引入non-local思想来增强对三维点云中上下文信息的收集,并提升分割模型对点云语义的判断。然而,直接在点云上应用non-local策略往往会因为点云数据过大而造成网络计算复杂度和空间占用的大幅提升。为了解决这一问题,本文提出并构建了堆叠式non-local网络PointNL,通过层级化的non-local结构实现点云中上下文信息的渐进式传播,在提升语义分割性能的同时大大降低网络的计算复杂度。(3)三维场景的语义标注需要大量的人力和物力。针对这一问题,本文提出了结构化三维场景的半监督语义分割框架SSPC-Net。SSPC-Net首先利用无监督超点划分方法,将三维点云划分为多个不重叠超点,并将三维点的语义标签扩展至超点级语义标签。然后基于超点构建超点图,并建立图神经网络进行超点的特征表示学习。为了更好地传播有限的语义标签信息,本文提出了动态标签传播方法并结合超点修剪策略生成高质量的超点语义伪标签。此外,为了充分利用有限的监督信号和伪标签信息,本文进一步提出了耦合式注意力机制策略来提升标签信息的传播和对无监督超点特征的学习。在多个结构化室内及室外道路场景三维数据集上的实验表明,该方法仅利用少量的三维点语义标签就取得了良好的语义分割结果,甚至超越了部分全监督语义分割方法的性能。(4)针对语义分割模型泛化能力差的问题,本文进一步提出了面向结构化三维场景的无监督跨域自适应语义分割框架PCSeg-UDA。为了解决域间点云几何特征分布的差异性,提升网络从源域到目标域的泛化能力,该方法在目标域上动态生成伪标签进行自监督学习,并提出了跨域空间关联机制和多层级跨域循环一致性约束策略。跨域空间关联机制通过建立域间连接进行特征映射,从而实现两个域中几何特征的双向传播和增强。而多层级跨域循环一致性约束通过鼓励跨域环形路径上超点对保持更高的特征一致性,从而减小域间的特征偏移。结构化室内及室外道路三维场景的跨域实验表明,PCSeg-UDA具有良好的泛化能力,并在目标域上取得了有效的语义分割结果。
其他文献
在穿过折射率不均匀的散射介质(如毛玻璃、油漆、生物组织等)时,入射光会偏离原有的传播方向发生散射,使得成像系统只能探测到无规则分布的散斑图案,因此,散射介质通常被认为是成像的阻碍。近年来,研究人员提出了一系列能够利用散射光进行成像的方法,简称为散斑成像技术,其中,测量传输矩阵和波前整形优化具有原理直观且易于与其它方法融合使用的特点,已经被成功运用于显微成像、多模光纤内窥镜和光声成像等领域。然而,在
学位
有源电子扫描的相控阵天线具有波束扫描灵活,波束切换速度快和波束指向精度高等优点,被广泛应用于现代无线通信和雷达系统中。通信链路速率提高、雷达系统分辨率提高和电子系统多波形、多功能的发展趋势,对相控阵天线提出了宽频带、宽扫描角的迫切需求。另一方面,阵面上天线单元之间的互耦,会导致天线在波束扫描的过程中出现扫描盲点,继而影响天线的带宽和扫描角度。本文以提升二维相控阵天线的工作带宽和波束扫描能力为研究目
学位
高光谱遥感集合光谱和成像技术实现光谱数据和空间图像的同步获取,成为遥感技术的重大突破。高光谱图像由成像光谱仪以连续窄波段对目标场景同步采样生成,具有“图谱合一”的结构特性,能满足对目标物体成分组成和形貌特征的探测需求,在分类识别方面具有突出优势,因而被广泛应用于精准农业、地质勘测、环境监测和生物医学等领域。伴随着成像技术的不断发展,高光谱图像的光谱分辨率也越来越高,在提供高质量光谱信息的同时也对高
学位
卫星遥感图像记录了几十年来地球表面的各类信息及其变化,这些丰富的遥感图像已经被广泛应用于环境监测、城市规划、海洋遥感以及矿物勘探等重要领域。如何高效且准确地对遥感图像进行分析与理解,是遥感图像智能分析处理的关键。遥感图像处理技术发展的初期,研究者主要以基于像元的方式处理遥感图像数据,随着遥感技术的发展,卫星遥感图像的空间和光谱分辨率不断提高,基于像元的处理方法无法充分利用遥感图像中丰富的空间与光谱
学位
作为场景理解的关键性技术,图像语义分割一直是计算机视觉领域一个非常活跃的研究方向,它在自动驾驶、目标识别、人机交互、步态识别以及视频监控等方面有着广泛的应用。随着深度学习的发展,基于全卷积网络的语义分割技术取得了巨大的成功。然而,训练深层神经网络往往需要大规模带标注的训练数据,为语义分割任务获取像素级精确标注更是格外费时费力。因此,近年来,越来越多的研究者将注意力转向研究如何摆脱大规模像素级标注,
学位
轨道交通线网和站点的植入,承担着优化交通和城市结构的职责。而在大量站点周边,步行圈层引导下的土地价值衰减,造成相应城市功能和空间价值的衰减,导致相邻的多个站点难以整合联动。因此,如何充分发挥轨道交通站点的触媒作用,形成“以点带线,以线成面”的城市结构,成为值得深入研究的话题。而多站联动机制的形成,需要减弱步行圈层引导下的土地价值在远近距离上的差异度,由此在较远距离也能够进行较高价值的功能空间适配:
学位
呼叫中心是指通过电话等通讯媒介,为顾客提供业务咨询、信息查询、售后支持、交易处理等综合性服务的组织实体。据产业研究显示,近几年我国从事呼叫服务业务的呼叫中心企业越来越多,行业规模扩展迅速,从业坐席人数已超两百万。作为劳动密集型行业,制定科学合理的坐席人员排班方案是企业人力计划管理的重要技术手段。而实际坐席排班往往是高度企业场景依赖的,需要考虑各种不同的用工因素,其本质上是非常复杂的组合优化决策问题
学位
电热综合能源系统的能量管理关系到园区的经济效益与多能互补能力,但面临新能源出力随机性和用户负荷不确定性的挑战。本文首先构建电热综合能源系统能量管理问题的数学模型,将各供能子系统赋能为智能体,基于DDPG算法建立综合考虑子系统实时用能负荷、分时电价及各设备出力的系统能量管理模型。其次,采用联邦学习技术,在训练过程中交互三个子系统的能量管理模型梯度参数对模型的训练效果进行协同优化,打破数据壁垒的同时保
期刊
图连接互联系统是一类子系统互异且以任意无向图作为拓扑结构耦合连接而成的大规模互联系统,互联系统的每个子系统都具有独立的传感、计算和驱动模块,子系统间通过特定的通信链路交换信息以达到相互协作完成任务的目的.互联系统在实际工程中具有广泛的应用,例如电力系统、机器人编队系统、自动高速公路系统、卫星组网系统等.本文主要研究了连续时间互联系统的H2性能分析及H2分布式控制问题、广义KYP引理、有限频H∞分布
学位
随着现代光电技术以及红外制导技术的飞速发展与逐步完善,各种侦查、制导系统的全天候作战能力、高精度制导能力以及目标识别能力等均大幅提升,对武器装备的战场生存能力产生了极大的威胁。利用红外诱饵可以模拟与真目标相似的红外辐射特性,进而降低光电系统探测识别真目标的概率,分散和消耗敌方精确制导武器,实现导弹突防。因此,诱饵的红外辐射特性控制研究具有重要的应用前景和军事意义。本文通过建立中段弹道导弹及其仿形诱
学位