结合局部特征与空间关系的多物体检测算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:rdview
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的进步和智能设备的普及,当今互联网上的交流已经突破了文字的局限,而更加青睐包含更多内容的数字图像和视频。因此,如何对这些图像和视频数据进行处理和分析,获知这些数据背后存在的意义,并利用这些数据优化决策的技术,是大数据时代研究的热点。为了理解这些图像和视频的语义以供进一步分析,可靠的物体检测技术具有广泛的应用需求和应用前景。同时,作为计算机视觉领域的一个重要课题,物体检测对于解决计算机视觉领域的其他问题,如语义分割(Semantic Segmentation)、物体解析(Object Parsing)等也有重要的研究意义。但是,由于数字图像中的物体受到尺度、旋转、视角、姿态、光照等因素影响,且当图像中存在的多类物体间存在互相遮挡等空间关系时,现有的算法难以正确而快速地识别图像中存在的物体。本文主要研究如何结合图像的局部特征和空间关系提高多类物体检测的准确率。首先,本文研究了基于局部特征的物体检测模型,分析了这些模型的优缺点并对比其性能。随后,本文实现了结合局部特征和空间关系的物体检测模型。该模型首先采用物体的局部特征对图像中可能存在物体的区域进行识别,随后利用预定义的空间关系建立结构化模型,并利用物体间存在的相对位置关系优化识别结果。由于图像中可能存在的物体类别,及物体间相互的空间关系种类繁多,对结构化模型进行训练和测试耗时较长,本文提出了阈值法和极大值法两种特征分离方法,将结构化模型转化为多组二值判别模型,从而克服了多物体检测的速度瓶颈。实验结果表明,分离算法可以用较小的性能损失来换取极大的速度提升。同时,采用极大值法分离的模型可引用更多的空间特征,如相对长宽比、重叠百分比等,从而提升模型的性能。现有结合局部特征和空间关系的物体检测模型大多采用预定义的空间关系来建立结构化模型。但是,这种空间关系并不准确,且难以捕捉物体间存在的丰富语义。因此,本文提出了一种采用数据驱动方式来挖掘物体之间存在的空间关系的算法。通过研究图像数据集中物体的相对分布特性,本文采用聚类的方式获得物体间相对位置的空间关系原型,并通过空间关系原型构建空间关系特征,采用结构化学习算法提升物体检测模型的性能。在常用的K-均值聚类(K-Means)的基础上,本文提出了对比聚类算法(Contrast K-Means)以更好地捕捉空间关系原型。实验结果表明,通过对比聚类获得的空间关系原型可以比K-Means聚类更好地描述物体间的空间关系。本文还研究了使用多种不同的编码算法构建的空间关系特征对检测结果的影响,并选择了最优的编码算法构建空间关系特征,提升了物体检测模型的准确率。在获得了物体间空间关系的描述后,本文研究了如何更好地利用物体间存在的空间关系。通常来说,不同类别的物体间存在的空间关系差别很大,但是,通过对数据库中物体间存在的空间关系进行统计后发现,即使是在特定的一对物体间存在的空间关系也可能有较大差异。这种差异主要是由于物体的姿态和视角发生变化而造成的。本文基于不同姿态物体间的空间关系建立了纺锤模型,并通过实验证明,考虑姿态变化的纺锤模型可以进一步地提升多物体检测的性能。
其他文献
无线定位技术是近几年来研究和应用的热点之一,其中基于时间的定位技术由于相对较高的精度引起了广泛的关注。但是基于网络的无线定位中传播环境复杂多变,多径现象普遍存在,并成
随着水下激光技术和科学可视化技术的发展,海底地貌绘制技术日益成熟,采用具有较高分辨率和较远作用距离的蓝绿激光距离选通水下成像系统,对海底进行探测,获得一系列多距离图
介绍了网格概念、相关标准、技术、研究现状等,搭建了小规模的网格系统原型并用于并行计算实验教学、网格研究等;提出了一种城域范围内基于网格技术的跨集群异构VOD系统实现
随着无线通信的发展,人们对高速移动通信的需求越来越迫切。正交频分复用(OFDM)技术是一种多载波调制技术,它具有抗多径衰落特性,可以获得高速数据和高频谱效率,适合无线环境中的
近年来,以软交换为核心的NGN成为电信产业的聚焦点,开发下一代的可持续发展的网络来支持话音业务和日益重要的数据以及多媒体业务已经成为众多电信运营商的战略目标.下一代网
随着互联网的发展,网络上的信息呈爆炸性增长,互联网已经成为人们发表观点和评论的重要载体之一,这些信息中蕴涵着极高的价值亟待人们去挖掘研究。现在最热门的社交网络、电子商
分形图像压缩编码是目前研究较广泛的图像压缩编码方法之一。它以理论新颖,解码快捷而倍受关注。 本文简单阐述了分形图像压缩编码的基本原理,并对当前具有代表性的分形编码
摄像机标定是计算机视觉领域中从二维图像获取三维空间信息必不可少的步骤,被广泛用于三维重建、导航、视觉监控等领域,因此其相关理论研究目前已成为计算机视觉领域的研究热点
时间序列指的是某种现象的统计标量在不同时间上具有各自的数值,并且按照时间先后顺序排列而成的数值序列。在天文学、地质学、气候学、生物科学等众多领域中,由于受到客观环