论文部分内容阅读
由于互联网的飞速发展以及移动终端设备的持续增加,图像的数据量急剧上升。庞大的图像数据必然会对图像处理技术提出更高的要求。如何从庞大的图像库中快速有效地找到想要的图像,已经成为了一个亟待解决且具有很大挑战性的任务。而图像标注技术是数字图像语义文本信息的重要技术之一,在数字图像处理的各个方面有着广泛的应用。在图像标注这一领域中,除了可以对现有的算法进行充分利用之外,还可以借助其他相关学科的帮助,来获取更好的标注效果。生物学中,人的视觉系统可以很快且准确地抽取图像的语义信息,因此,将人的视觉注意应用到图像标注的研究上算得上是一个有益的尝试。论文的主要研究内容如下:(1)分析和总结已经提出的显著区域检测方法,根据每个区域在整幅图像中所占面积,以及和周围区域的亮度方差,提出了一种新的基于视觉注意模型的方法。该模型旨在模拟人眼从图像中获取有意义信息的方式,从图像的底层特征出发,属于自下而上的检测方法;(2)分析和研究近年来图像标注的关键技术,将本文提出的视觉注意模型应用到图像标注中,提出了一种基于视觉注意模型和k-NN聚类算法的标注方法。首先利用本文提出的视觉注意模型获取图像的显著区域部分,然后对显著区域和非显著区域提取特征并进行特征融合,最后使用k-NN聚类算法对图像进行标注。通过实验表明,标注结果与显著区域和非显著区域所占比例有很大关系;(3)利用本文提出的视觉注意模型,将每幅图像的显著区域从图像中分离开来,分别对显著区域和非显著区域进行标注,然后分析显著区域和各个非显著区域标注词之间的关系,提出一种基于支持向量机和词相关性的标注方法。这种方法可以消除非显著区域对显著区域的影响,通过实验结果分析和对比,验证了该方法的可行性,并且该方法提高了图像标注的效果。