基于多实例表示的图像目标检测技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:why7981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着目标检测技术的深入研究,目标检测技术的发展呈现出一种由难及易的趋势,从一开始考虑到目标在图像中呈现的形态变化、角度变化等,早期的研究者希望寻找到这样一类特征,它具有旋转、大小、仿射等一系列不变特性,试图抽取一个万能的特征实现对于图像目标的检测分类等。这方面的研究随着一些局部区域不变特征点的提出,取得了一定的研究成果,在目标匹配和图像分类中都取得了一定的成绩,但是对于目标检测则一直未能很好的解决。直到人们对于目标检测问题进行简化处理,只对常态的人脸、行人等进行检测并提出了稠密的局部区域特征描述子,这个问题的解决才得到了比较长远的进步。但是基于稠密局部区域特征描述子如HOG特征,由于该特征主要反映的是检测目标的基本外形梯度特征,匹配的原则也只是从粗糙的外形上进行匹配,因此其对于单一外形特征的匹配效果很明显。而目前的检测方法多把类别作为区分的量度,同一类型里多外形特征反而被弱化,导致检测结果不明显,于是基于多实例表示的目标检测技术在这些年得到了大力的发展。其核心思想对训练集中的检测样例,每一个都训练自己的分类器,综合所有的一类目标的分类器实现对于该类目标的检测。本文就多实例表示的目标检测方法进行研究,具体研究内容如下:(1)从数据集大小的角度分析了多实例表示的图像目标检则技术的性能增长情况,具体分析20类检测目标的增长情况。实验表明,检测结果的性能随着数据集规模的变化按照检测类别的不同,呈现出不稳定的变化规律,其主要原因在于数据集中数据的多样性,对于固定的测试集,每一个检测样例都会有一定数量的检测结果,检测性能的变化随着训练集与测试集中数据在HOG算子下的匹配值变化而变化,因此表现出不稳定性。基于此,后续从HOG局限性以及根据已有数据集构建合理的初始实例库进行分析与研究。(2)考虑到上述实验在使用单一特征HOG算子作为检测特征时存在的局限性,通过融入SURF特征的方式来提高系统的检测性能。由于SURF是对感兴趣点的抽取,因此特征点的个数不定,所以将融入过程加在校准过程,结合初始的检测分数以及检测结果与原始实例的SURF特征匹配度,构成总的得分用于共生矩阵的生成,从而达到弥补各自在检测上的局限性,提高系统的检测性能的效果。(3)从构建合理数据实例集的角度分析,来提升模型的检测效率。首先从单张图片的角度分析有利于提升系统单实例召回率的方法,本文主要分析的有k-means聚类算法以及基于线性SVM分类结果的聚类算法。通过使用两类聚类算法,构建召回率更高的检测实例库,使得系统的检测性能得到了提升,该方法的实现原理就是将一类检测目标细化的同时最大化的利用HOG特征能表述的轮廓范围,构建出一类目标的实例库,实验表明,该方法不仅提升了系统的检测性能,同时检测速度也得到了很大的提升,同时将上述实验组合实现了一套基于多实例表示的目标检测系统。
其他文献
细分曲面长期以来一直都是计算机图形学的经典研究方向,伴随着几十年的发展,且其研究成果已经被广泛地应用于制造业、游戏、娱乐以及电影工业等领域。细分曲面的结果通常都是很
随着人们生活质量的不断提高,旅游行业迅速崛起,在国民经济中占据着举足轻重的地位。云南省顺应时代的发展,在当前的发展优势下紧紧抓住这个机遇,大力发展旅游业,现已成为国
集成学习是当前机器学习领域研究的一大热点,因其具备显著增强学习机泛化性能的能力和有效解决学习机过学习问题的优点,而备受研究者的关注。本文就是从集成学习的角度来研究图
设计模式定义了面向对象软件系统里经常出现的一组类和这组类之间的关系,以及它们的目的。在过去的十几年里,设计模式被广泛地应用到软件工业领域。另一方面,随着软件系统的规模
随着网络通信技术的发展和互联网信息资源的不断扩大,信息过载现象日趋严重。传统信息服务的出现在缓解了信息过载问题同时因其面向公众的通用性需求特性,无法满足用户的个性
近些年来,人们对于嵌入式系统的应用需求不断增长,使得嵌入式系统的复杂性不断增加,规模不断增大,系统的不确定性越发明显,这些原因都给开发人员带来了新的挑战。传统的嵌入式系统
本文提出了一种基于单张图片的既能保持面部细节特征又能对人脸轮廓进行胖瘦调整的方法。首先,使用自适应的方法从单张图片重建人脸的三维模型。然后导入预先设定的特征点,根
伴随着期货行业的快速发展,期货公司如何真正实现管理手段的信息化、决策管理的科学化,同时满足行业合规性要求成为项重要课题。在当前竞争形势下增强对期货经纪人的管理和控制
随着互联网技术的发展,为更好地承载信息和提升用户体验,网页中的图片越来越多。对于残疾人,特别是视力残疾人,通过辅助工具访问网页时,图片内容的信息获取来源是图片的替代
随着信息技术的不断发展,嵌入式系统联网应用变得十分普及。目前,IP网络及其应用正处于IPv4向IPv6过渡时期,由于IPv6不是向下兼容的,因此IPv4网络应用不能直接过渡到IPv6环境中。