【摘 要】
:
基于内容的图像检索能够克服单纯基于文本的图像检索在主观性和歧义性方面的缺点,而对图像内容的描述和特征提取是决定基于内容的图像检索性能的最关键因素。随着视觉显著性
论文部分内容阅读
基于内容的图像检索能够克服单纯基于文本的图像检索在主观性和歧义性方面的缺点,而对图像内容的描述和特征提取是决定基于内容的图像检索性能的最关键因素。随着视觉显著性理论和深度学习技术的发展,人们尝试从视觉显著性以及利用卷积神经网络学习图像特征的角度来缩小图像可视化特征与图像语义之间的语义鸿沟,并取得了一些卓有成效的成果。本论文在分析图像显著性的基础上,提出一种基于图像显著区域特征和深度学习的图像检索模型,同时设计并实现了相应的图像检索原型系统来验证本文算法的性能。首先,为了准确地提取图像显著区域,本论文设计了一种基于显著图的全自动图像分割算法——AutoGrowCut。该算法使用多尺度显著性检测算法得到显著图,对显著图进行初步阈值分割后使用形态学处理得到分割的预标注,在标注的基础上使用元胞自动机算法提取显著区域。AutoGrowCut在降低了人工工作量的同时能够基本达到人工分割的效果。通过将本文分割算法应用到图像检索中,实现对图像特征的更加准确的描述,以提升检索准确度。然后,为了缩小图像检索的语义鸿沟,本文研究了一种基于图像显著区域的分类方法来获取查询图像的语义类别,检索同类别的相似图像,进一步提升检索准确度。本文用图像显著区域代替原图作为网络输入,可直接获取图像显著区域语义类别,克服了背景信息的干扰。实验选用THUR图像库和ImageNet图像库中图像进行测试,结果显示本文方法能提升图像分类准确度。最后,综合本文提出的基于图像显著区域特征和深度学习的图像检索算法和模型,设计并实现了一个图像检索原型系统,包括图像显著区域特征库离线建立模块、卷积神经网络分类器离线训练模块、图像在线类别判定模块和图像在线检索模块。通过实验表明基于显著区域特征的图像检索将查准率从基于原图特征的68.75%提升到81.25%,考虑深度语义信息能进一步优化查准率,实验验证了本文基于图像显著区域和深度学习的图像检索的有效性。本文研究的图像检索模型符合人类视觉感知特性,对于促进图像的信息提取和图像的准确检索具有理论及应用价值。
其他文献
如今计算机技术突飞猛进地发展,人们生活的方方面面越来越依赖于信息系统,而数据库作为信息的核心载体,其中保存着大量数据,并且越来越多的数据涉及到国家机密等敏感信息,要
模型试验技术已经成为研究和解决基坑问题的主要方法之一,在国内外已得到了广泛应用,并在工程科研、设计及论证中发挥了重要作用。但是国内外相关研究存在着以下主要问题:对
非常感谢董老师的邀请,从前面各位嘉宾的演讲中,我也学到了很多东西。我想今天我主要的分享内容还是我们的主题,受托人责任。第一个话题是英美法系的资本市场为什么更发达?第
我国工业系统发展迅速,高精度的机械零部件逐渐有越来越大的缺口,螺纹工件是一种机械行业中常见的连接零件,在工业产品中有着广泛应用。由于对螺纹质量要求提高使得外螺纹检测系统发展迅速,融合视觉的外螺纹检测系统因为检测速度快,测量精度高等优点,在螺纹检测系统中占据越来越重要的地位。本文通过研究其他文章提出的外螺纹检测方式,创造性提出了一种新型的考虑轴线倾斜情况下的圆柱外螺纹轴线倾斜牙型修正算法,并根据算法
高中思想政治课课后作业设计作为教学设计中的一个环节,这一环节的设计与实施好坏影响着作业的有效性,优化课后作业设计就是提高作业质量,将课后作业的巩固、监督、检测和调节功能发挥得更好。从课后作业设计自身的角度出发,在新课程改革的背景下,新课程标准不仅对课程提出了新要求,也对教学设计提出了新方向。那么,课后作业设计自然也需要及时更新,适应时代的发展和新课程的要求。从外部因素出发,近几年来社会各界、家长和
党的十九大报告提出,“提高社会治理社会化、法治化、智能化、专业化水平”。司法作为社会治理的重要组成部分,将人工智能技术应用于司法实践是司法智能化的必然要求。面对各领域对人工智能技术的深入探讨,司法领域也不应落于人后。本文综合运用了数据分析、文献归纳、跨学科分析等研究方法,从人工智能的概念出发,了解了人工智能的发展现状。从当前社会中人工智能的具体应用分类方面对人工智能进行了梳理。从节约司法资源、强化
攀爬机器人在高难度、高强度和高危险的作业任务中具有广泛的应用前景。当前,制约攀爬机器人落地的重要原因是其自主定位导航技术尚不成熟。本文主要研究攀爬机器人自主定位导航中的构图模块和定位模块。其中,构图模块包括两部分研究内容:基于同步定位与建图技术构建三维壁面环境地图,以及三维壁面环境的结构化表达方法。定位模块研究实时追踪攀爬机器人位姿的算法。主要内容如下:(1)研究多传感信息融合的攀爬机器人构图算法
对于移动机器人来说,一个基本的场景重建过程包括了环境感知、移动机器人的定位与位姿优化、地图的生成与拼接、重定位等步骤。本文着重研究了其中的环境感知、位姿优化、重定位三个部分,并以此构建了一个完整的移动机器人场景实时重建系统。本文研究了一种基于三目相机信息融合的高精度深度感知算法。传统的基于被动测距的立体视觉算法,常常对环境中的纹理有强依赖性;而深度相机不依赖于纹理,但输出的分辨率较低,且易受环境光
在当今这个大数据的时代,越来越多的生产和活动被数据化到网络和数据库上。这些大数据记录了人们生活的方方面面,研究这些数据会发现许多有价值的信息。诸如沃尔玛超市将尿布
随着石化能源的日益减少,人们对环境、能源的问题逐渐重视,可持续的、环境友好的新能源越来越受人们重视,其中,丙酮丁醇梭菌发酵法生产丁醇、丙酮、乙醇具有极大的发展前景。