基于掩膜细化与特征融合的目标感知方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:l907603912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测和实例分割分别提供目标级和像素级的图像目标以增强图像整体感知能力,成为计算机视觉重要的任务,且被广泛应用于行人检测、视频监控、零部件识别定位、智能医疗诊断等领域。由于各领域任务对于图像目标感知的程度要求日趋提高,传统图像感知算法的速度与精度已无法达到其要求。因此近年来基于深度卷积神经网络的实例分割和目标检测一直成为业界的研究热点并取得了突破性进展,但往往在精度和速度上无法兼顾。本文分别致力于在不增加明显的计算量的情况下提升单阶段实例分割网络的分割性能和目标检测网络的检测性能,分别提出了一种基于轮廓点掩膜细化的单阶段实例分割方法和一种基于特征金字塔信息补充的目标检测方法。本文针对现有的实例分割方法PolarMask中分割结果边缘信息模糊的问题,提出了一种基于轮廓点掩膜细化的单阶段实例分割网络来优化分割图的边缘信息。本文通过所提的掩膜预测子网络预测出实例轮廓点的角度偏置和距离以提取实例的准确轮廓。语义分割子网络通过将特征金字塔输出的不同尺度特征层统一大小,对浅层的特征细节信息和深层的特征语义信息进行融合,生成每一类别的语义分割图,再与掩膜预测子网络输出的实例轮廓融合,从而得到精细的实例分割结果。本文基于所提模块设计的实例分割网络,在相关数据集实验表明该算法在不影响检测速度的情况下,实现较高的实例分割精度。另外,为了提升目标检测网络的检测精度,针对特征金字塔只关注相邻分辨率特征图之间的信息,难以充分利用各个层级特征图的语义信息和细节特征的问题,结合特征融合和注意力机制,本文设计了一种基于金字塔信息补充的目标检测方法。该模块主要包括特征整合模块,特征关注模块和特征残差模块。特征整合模块用于将特征金字塔输出的不同层级特征通过不同的权重进行融合,然后通过特征关注模块对特征分别进行全局和局部增强,之后通过特征残差模块将增强后的特征与原特征经过上/下采样生成的细化特征进行融合,最终输入到之后的检测网络中。在不明显增加计算时间的情况下,在Pascal VOC数据集上的目标检测精度达到81.6%,相对于基础方法提升了1.6%,证明了所提基于金字塔信息补充的目标检测方法的有效性。
其他文献
报纸
报纸
三维目标检测是场景理解任务中的基础问题之一,在智能驾驶和机器人感知等领域有着广泛的应用前景。基于不同传感器数据的三维目标检测算法在性能、效率以及应用场景等多个方面均存在差异。能获取精确距离的激光雷达和具有较高分辨率的双目相机常作为主要的感知设备应用于智能驾驶系统。激光雷达通过发射特定波长的激光束并接收目标回波以获取场景的三维点云。当前基于点云的三维目标检测算法存在两个问题。一是在点云的特征提取网络
学位
视频片段检索旨在依据给出的查询信息,在未经剪辑的长视频中检索出与查询内容相关的视频片段。本文的工作使用一段视频作为查询信息,给定查询视频,可以从参考视频中提取出与查询视频具有语义相关性的内容片段,并确定其起止时间。这项技术被称为基于视频查询的视频片段检索。在实际应用中,这项技术可以更智能的为人类提供视频选择,有效地减少用户浏览相关感兴趣视频的时间,还可以应用于视频监控和基于视频的人员重识别任务等其
学位
水下图像存在颜色失真、细节模糊、对比度低等问题,直接影响水下目标识别与跟踪等工作,严重影响了计算机视觉系统在海洋研究中发挥效用,水下图像清晰化研究具有重要的理论意义和应用价值。目前基于有监督学习的水下图像复原方法通常需要高质量的清晰图像作为参考,而其在现实的场景中难以获取;使用合成数据作为训练数据集的复原方法则难以适用于真实场景。基于此,论文提出两种基于无监督学习的水下图像复原方法,具体工作如下:
学位
水下图像承载着水下环境的重要信息。由于受到光吸收和散射的影响,水下图像存在颜色失真、对比度低、模糊、光照不均匀等明显的质量退化问题。退化的水下图像直接影响其在水下目标检测、水下场景理解、水下三维重建等方面的进一步应用。因此,关于提高水下图像质量的研究具有重要意义。随着深度学习技术的快速发展,基于弱监督学习的水下图像增强方法受到广泛的关注,但现有的增强方法处理后的水下图像仍存在色偏、细节模糊等问题。
学位
从天气预报到股指预测,时间序列预测在方方面面都起着至关重要的作用。然而,实际场景下的时间序列往往具有极强的非线性和较低的可预测性,传统方法往往差强人意。同时,随着社交网络的发展,越来越多的用户在网络上表达自己的观点,这些观点中的情感信息可以辅助解决相关的预测问题。在目前的研究中,用户的情感信息尚未得到充分利用。为了实现及时准确的预测,本文出了情感分析和深度学习相结合的方法——融合情感分析的时间序列
学位
显著性对象检测旨在着重标示图像或视频场景中在语义层面上引人注意或感兴趣的区域或对象。显著性对象检测可以作为预处理步骤,为其他复杂的计算机视觉应用任务提供帮助。当前,它已经被广泛应用于目标跟踪、图像分割、目标检测等任务中。显著性检测目前依旧是具有挑战的计算机视觉任务,因为具有复杂形状和任意大小的显著物体通常难以精确地检测,尤其是在杂乱的背景和复杂的场景中。由于考虑到基于单一层次特征预测显著物体的缺陷
学位
实际生活中采集的图像由于光照环境、图像采集设备、拍摄人员的不稳定性通常存在不同程度的低光照或光照不均匀等情况,制约了其在跟踪和检测等计算机视觉任务中的作用。因此通过图像增强算法提高图像的对比度和信息丰富程度,并降低噪声具有重要的现实意义。现有的图像增强方法往往存在亮度提升不明显、亮度提升过强、图像暗区域细节恢复不完全、图像亮区域细节丢失等问题。针对这些问题,本文提出了两种图像增强算法分别实现亮度的
学位
在当前互联网和知识经济时代,社会对于高质量人才培养的重视不断加强。因此,高职院校需要探索适应新形势下学生教育管理工作的方法,并在此基础上进行创新。文章建议高职院校应注重提高教师队伍整体素质、树立以人为本的教育管理观念、构建高效系统的学生教育管理机制、建立健全高质管用的学生自治组织、提升学生管理工作的信息化水平。如此,高职院校才能真正成为培养高质量人才的重要基地。
期刊