论文部分内容阅读
随着带拍照功能的移动智能终端的广泛普及和互联网技术的迅猛发展,我们已经步入“移动互联网时代”和“读图时代”,拍照检索日渐成为人们对真实世界检索的重要入口之一。 在拍照检索中,人们往往更多关注的是图片中某个感兴趣的目标,如商品、场所、标志等,而不是整个图片的内容。这给基于内容的图片检索研究提出了新的需求,即从图片级检索精细化到目标级检索。由于拍照检索中待检索的图片大多是用户在日常生活的真实场景中拍摄的,背景复杂多变且与图片库拍摄环境差异较大,而且通常会包含多个非感兴趣的目标,这给基于内容的目标级图片检索带来较大的技术挑战。针对上述问题,本文围绕交互式目标分割、目标检索展开研究,主要工作如下: 1.针对以往交互式分割中不能较好地平衡交互复杂度以及交互带来的信息量的问题,提出了一种新的交互式分割算法LinedCut,该方法利用用户在要提取的目标上画一条线来获取交互信息,交互方式简单便捷。同时,该方法能较好地处理要提取的目标的尺度问题。此外,该方法通过嵌入一个与交互线的距离刻画函数,对前景背景色彩分布差异不是很大的图片,也能提供较好的适应性。 2.在上述交互式分割算法基础之上,提出了一种基于目标提取的检索算法框架。整个检索过程先通过交互式目标分割提取出待检索的目标前景,然后在这个目标前景而不是整图上提取特征,最后用提取出的特征来进行检索。其中,提取的特征包括颜色特征和基于码本的关键点特征。距离融合方式,在详细讨论了前融合与后融合各自优缺点的基础上,采用后融合的方式。在小规模数据库上的实验结果表明,该方法可有效去除背景干扰,提取复杂形状目标,解决图像中存在着多个目标等问题,从而使得检索效果相较于传统的基于整图的检索有着不错的提升。 3.基于以上算法,设计并实现了一个基于交互式目标分割的图像检索系统,该系统具有在线图片目标注册、目标检索、查看检索结果的详细信息等功能,系统较好地分离了后台数据处理过程和前台显示样式,具有较高的可扩展性。 总的来说,本文在交互式图像目标分割与检索方法上开展了一些探索研究,将传统的基于内容的图像检索从图片级扩展到目标级,可以为移动互联网时代的拍照检索应用提供一条可行的途径。