交互式图像目标分割及检索系统

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xxp520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着带拍照功能的移动智能终端的广泛普及和互联网技术的迅猛发展,我们已经步入“移动互联网时代”和“读图时代”,拍照检索日渐成为人们对真实世界检索的重要入口之一。  在拍照检索中,人们往往更多关注的是图片中某个感兴趣的目标,如商品、场所、标志等,而不是整个图片的内容。这给基于内容的图片检索研究提出了新的需求,即从图片级检索精细化到目标级检索。由于拍照检索中待检索的图片大多是用户在日常生活的真实场景中拍摄的,背景复杂多变且与图片库拍摄环境差异较大,而且通常会包含多个非感兴趣的目标,这给基于内容的目标级图片检索带来较大的技术挑战。针对上述问题,本文围绕交互式目标分割、目标检索展开研究,主要工作如下:  1.针对以往交互式分割中不能较好地平衡交互复杂度以及交互带来的信息量的问题,提出了一种新的交互式分割算法LinedCut,该方法利用用户在要提取的目标上画一条线来获取交互信息,交互方式简单便捷。同时,该方法能较好地处理要提取的目标的尺度问题。此外,该方法通过嵌入一个与交互线的距离刻画函数,对前景背景色彩分布差异不是很大的图片,也能提供较好的适应性。  2.在上述交互式分割算法基础之上,提出了一种基于目标提取的检索算法框架。整个检索过程先通过交互式目标分割提取出待检索的目标前景,然后在这个目标前景而不是整图上提取特征,最后用提取出的特征来进行检索。其中,提取的特征包括颜色特征和基于码本的关键点特征。距离融合方式,在详细讨论了前融合与后融合各自优缺点的基础上,采用后融合的方式。在小规模数据库上的实验结果表明,该方法可有效去除背景干扰,提取复杂形状目标,解决图像中存在着多个目标等问题,从而使得检索效果相较于传统的基于整图的检索有着不错的提升。  3.基于以上算法,设计并实现了一个基于交互式目标分割的图像检索系统,该系统具有在线图片目标注册、目标检索、查看检索结果的详细信息等功能,系统较好地分离了后台数据处理过程和前台显示样式,具有较高的可扩展性。  总的来说,本文在交互式图像目标分割与检索方法上开展了一些探索研究,将传统的基于内容的图像检索从图片级扩展到目标级,可以为移动互联网时代的拍照检索应用提供一条可行的途径。
其他文献
该文以黑龙江省自然科学 基金资助项目《基于混沌神经网络的混沌控制系统的研究(F9713)》为背景,研究了混沌理论以及细胞神经网络中的混沌现象,并在此基础上对混沌理论在保
该文以"马鞍山钢铁股份有限公司管理信息系统(MGMIS)下的马钢标准管理子系统"的开发为背景,阐述了马钢标准管理子系统和标准全文检索系统的开发与研制的方法、过程和开发中的
Agent技术的迅猛发展使以Agent为基本构件的智能技术成国为工智能领域中的焦点技术.该文在总结了近年来Agent技术的发展的基础上,着眼于建立一个以Agent为基本构成元素的智能
该论文在明确汉字识别技术的概念及其研究内容,对已有汉字识别中预处理技术的各种方法进行分析和评估的基础上,提出了对已有算法的改进并且对其效果进行了试验验证.
IPM智能电力仪表是一种集参数采集、处理、传输、控制、异常事件记录等功能能于一身的测控装置,它通过数值计算,可以测量出三相电的电压、电流、功率、频率等四十余个电力参
该文对数据融合及处理技术在双机多传感器多目标跟踪中的应用进行了研究,力求探索一种较好的数据融合方法.
用WEB技术访问管理资源已成为信息时代发展潮流,它不仅推动了Internet/Intranet的发展,也使一种新的计算模型Browser/Server应运而生.Browser/Server计算模型不仅能提供传统C
在控制领域,最优控制一直是理论方法和工程实践的一个重要研究方向.它要求找到一个使性能指标最大(或最小)的控制策略.强化学习(ReinforcementLearning,RL)能够有效解决最优控制
复杂场景下的目标跟踪是计算机视觉领域中的研究热点之一,是高层行为理解和视频分析的基础。在基于视频的安全监控、智能交通信息系统、视频内容分析和检索、人机交互等方面具
该文集中讨论了采用无导数直接迭代方法求解方程组的人一维空间迭代收敛加速的埃特金(Aitken)法几何意义入手,推广到n维空间,拓宽了迭代收敛加速的埃特金(Aitken)法的应用范