基于深度学习的三维场景语义分割算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:m237912904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉中,三维语义分割是三维场景理解和分析的重要基础,在无人驾驶、自主机器人、增强现实等三维感知领域中被广泛应用,提高语义分割的精度对于语义理解和分析具有重大意义。目前,基于深度学习的三维语义分割算法的性能大大高于传统的分割算法,但在准确性上还不能完全满足实际需求,精度仍然还存在很大的提升空间。本文以提高三维语义分割精度为目标,研究基于深度学习的三维语义分割算法,具体研究内容如下:
  PointNet是点云三维语义分割中的先进算法之一,本文在PointNet的基础上进行改进,提高语义分割的精度。针对PointNet没有利用点云的局部结构,导致其识别结构复杂物体能力低的问题,本文提出了多尺度局部特征提取模块,该模块通过KNN算法搜索点云局部邻域,学习邻域中每个特征对于局部特征的贡献度,加权求和得到局部特征,将多个尺度的局部特征连接起来得到多尺度的局部特征;针对PointNet无差别对待所有的特征通道,限制了网络表述能力的问题,本文通过通道注意力提升模块,自适应地学习不同通道特征的重要程度,提升重要通道特征的权重,抑制不重要的通道特征;最后,连接多个层次的全局特征和点特征进行语义分割,并利用加权损失函数辅助训练。与PointNet模型相比,本文算法的总体分割精度oAcc提高了7%,平均交并比mIoU提高了9.8%,并且可以更好地识别出空间结构复杂的物体以及在局部的分割细节更加清晰。
  为了进一步将应用越来越广的RGBD图像用于三维语义分割,本文研究了基于RGBD多帧融合的三维语义分割算法,提高了图像语义分割的精度,并且通过多帧融合得到良好的三维语义分割结果。首先,本文提出一种基于双数据流的RGBD语义分割算法,针对图像语义分割中没有充分利用深度信息的问题,利用两个ResNet网络分别提取RGB特征和深度特征,设计了多模态特征融合模块用于自适应地选择RGB特征和深度特征的重要部分进行充分融合,减弱了RGB图像受光照、遮挡等因素的影响;针对深层网络因为下采样导致分割结果粗糙的问题,通过低分辨与高分辨率特征的逐级融合,从而提高分割结果的细节和精度。然后,通过贝叶斯法则将多帧RGBD语义分割的结果进行融合,从而实现三维语义分割。与ResNet网络相比,本文的双数据流语义分割算法的总体分割精度oAcc提高了4.81%,平均交并比mIoU提高了7.69%,并且不容易受纹理信息的错误影响,分割细节要更加清楚,通过有效融合多帧图像语义分割结果,得到效果良好的三维语义分割效果。
  实验证明,本文基于点云的三维语义分割算法在分割精度上超过了PointNet模型。在本文RGBD多帧融合的三维语义分割算法中,RGBD二维语义分割精度高,并且通过有效融合,得到了三维语义分割结果,从而验证了算法的可行性和有效性。为了采集三维点云和RGBD图像,本文设计和实现了三维点云场景采集系统和RGBD图像采集系统,从硬件和软件两个方面进行方案的阐述。最后总结全文工作,确定下一步研究方向。
其他文献
【摘 要】基于学生学习现实,在主题目标引领下,以创设问题情景切入,连点成线,贯穿于课堂始终。师生间互动发展,学生在现实的情境中体验和理解,以教学目标为圆点,创设辐射性教学情境,巧妙地融和审美核心价值观、优秀传统文化,体现正确的育人导向,突出立德树人的内涵。  【关键词】核心素养;问题;情境;现实  【中图分类号】G633.955 【文献标识码】A  【文章编号】2095-3089(2018)15-
期刊
随着老龄化社会的到来,阿尔兹海默症(Alzheimers Disease,AD)患者不断增多。医学影像技术的发展为AD的诊断及治疗提供了有力支持,其中,功能磁共振成像(functional-MRI,fMRI)技术是一种研究AD的有效手段,可用于构建基于机器学习的AD辨识系统。然而,AD病例的收集比较困难,因而如何从小样本集的fMRI影像中获取疾病识别的有效信息是AD辨识的研究重点。本文以机器学习为基础,对基于fMRI的小样本集AD检测方法进行了研究,具体包含以下几个方面:
  首先,针对小样本集的f
水面无人艇具有体积小、机动性好、应用范围广和成本低等优点,在民用和军事层面均有很好的应用前景。深入研究无人艇不仅具有巨大的经济价值,也对我国国防事业有着重要而深远的意义。海上目标检测识别是水面无人艇的关键技术之一,目的是实时、准确地识别检测出无人艇周围的障碍物目标。基于视觉的目标检测方法具有成本低和应用范围广等特点,非常适合应用于无人艇。但现有海上目标检测算法多在实验室进行验证,对无人艇实际应用场景和需求把握不全,直接应用于无人艇存在准确性低、实时性较差等问题,导致对周围环境感知能力减弱,无法有效保证无人
无论在军用还是民用方面,目标跟踪都广泛应用于生产和生活领域。面对迁徙的动物群、机场内的飞鸟、无人机群等进行跟踪时,需要对这些目标整体进行自动跟踪处理并获得每个个体的运动轨迹。因此,群目标跟踪技术的研究具有广泛的应用前景。但是,由于群目标跟踪过程中,干扰较多、尺度范围较大、目标种类多、背景复杂多变,跟踪任务面临一系列挑战,这使得群目标跟踪技术的研究需要较高的理论基础。针对这些问题和难点,本文以这些高度相似的运动多目标整体为对象,深入研究了面向群目标的跟踪技术。
  本文构建并标注了一个群目标跟踪数据集
生物计算是将信息编码到生物分子中,利用生物技术手段处理信息的研究领域。膜计算是生物计算的重要研究领域之一,旨在借鉴活细胞处理与交互物质的方式,抽象出被称为膜系统的计算模型。脉冲神经膜系统是根据神经元之间信息处理与交互的方式抽象出的模型,被认为属于第三代神经网络,具有广泛的应用前景。带电荷的脉冲神经膜系统和带反脉冲的脉冲神经膜系统是脉冲神经膜系统的两类重要变体。带电荷的脉冲神经膜系统使用了三种电荷,存在电荷数目能否优化的问题。带反脉冲的脉冲神经膜系统在同步模式下已被证明是图灵通用的,然而在局部同步模式下的计
【摘 要】每个学生就是一个独特的个体,一生一世界,要做好“一生一研”工作就是要尊重每个学生的个体差异,基于学生不同的需求提供个性化的辅导。  【关键词】一生一研;个性化;辅导策略  【中图分类号】G642.46 【文献标识码】A  【文章编号】2095-3089(2018)15-0276-01  佛家常說:一花一世界!这是一种人生的境界,我们要从一朵花悟出整个世界;一“生”一世界,这是一种教育的境
期刊
【中图分类号】R- 052 【文献标识码】A  【文章编号】2095-3089(2018)15-0283-01  正能量是一个暖炉,在冰冻三尺的严冬为人们提供温热;正能量是一个香甜的馒头,让肚子饿的人带来一顿午餐;正能量是一把折扇,能够扇走热风,为人们带来一丝凉意……正能量可以感动我们的内心,可以让我们努力拼搏,这种能量能在社会中产生积极上进的精神品质。正能量,仿佛一首没有写完的诗篇,等着我们去续
期刊
相较于传统两电平PWM变换器,三电平变换器因其输出谐波含量低、开关频率低、效率高等优势得到越来越广泛的应用,三电平变换器技术的发展将会改善变频器性能,提高电源的利用率,降低对电网的谐波干扰。本文以T型三电平双PWM变换器为研究对象,针对三电平变换器动态性能、谐波干扰、中点电位平衡和共模电压等问题开展了理论分析和控制方案研究。
  本文在分析三电平变换器的工作原理基础上,推导了三电平双PWM变换器整流侧和逆变侧的数学模型,给出了三电平60°坐标系下SVPWM算法以及实现方法,研究了三电平变换器产生中点
四象限变频器由于具有能量可双向流动、网侧电流谐波小、功率因数高和直流母线电压可控等优点常应用于油田抽油机、电梯和提升机等电机可进行能量回馈的场合。但传统四象限变频器仍存在逆变侧恒压频比控制下低频机械特性差、整流侧周期性扰动不可消除、整流和逆变独立控制下负载突变时母线电压波动大以及变频器并联时环流影响系统稳定性等问题。本文针对四象限变频器系统中存在的上述问题,分别从增强低频时电机机械特性、减小整流侧输入电流谐波、减小母线电压波动和减小变频器并联环流等方面展开研究。
  针对逆变器,本文以异步电机为控制
伴随着我国工业化进程的不断加深,由此产生的资源消耗、环境污染以及生态保护等问题成为我国在可持续发展的目标中亟待解决的问题。在我国,电能是工业生产中主要的能源消耗形式,而以永磁同步电动机为代表的电机是工业结构中最广泛使用的组成设备之一。为了更进一步简化电机带动控制系统结构,降低电机运行的环境要求,出现了无位置传感器控制技术。本文以提高永磁同步电机驱动器的动态响应,简化控制结构为目标,针对永磁同步电机无传感器控制技术进行了深入的分析与研究,提出了基于流频比(I/F)技术和模型预测控制(MPC)技术的全速度范围