论文部分内容阅读
随着科技的发展,移动终端设备得到了普及。移动终端时时与网络交互数据信息,导致网络上的图片呈现爆炸式的增长。这些图片无序、散落在世界的各个地方,但是人们对这些图片分析和处理有限。怎样能使用户有效从这些杂乱无章图片库中搜索到自己所需要的图片,其成为人们所关注的焦点。图像检索技术分别经历了文本检索、基于内容检索、多示例检索等阶段。近年来,多示例多标记学习已经成为机器学习研究的热点。本文提出了基于改进的多示例多标记学习算法,并将其应用到图像检索中。文章首先介绍了图像检索的发展背景、研究现状及相关应用。其次介绍了所用到的算法和技术,其中包括多示例多标记学习、K近邻、K-means算法、MIMIBOOST算法、MIMLSVM算法、多核函数。最后,针对图像检索中存在的问题提出了新的算法,并将其应用到图像检索中,通过实验的分析和对比来验证算法的有效性。研究者对图像检索做了很多工作,在这些研究当中仍然存在缺点,针对检索技术存在的问题本文做出了如下几点创新:(1)将机器学习中的多示例多标记学习算法应用到了图像检索当中,从而提出了一种多示例多标记的图像检索框架。一幅图像有完整的语义信息,而在对图像标记的过程中仅仅用单一的类别标记来描述图像。对图像仅用单一的标记势必会丢失一些重要的语义信息,对图像检索的结果有影响。这种方法主要是将图像的显著性特征区域用底层视觉特征向量构成示例,从而将示例与图像的类别标记关联。在处理图像检索时候需要对视觉特征包处理,可以利用本文提出的学习框架。(2)在图像的标注过程中,利用图像标记之间的关联度来提高标签的准确率,从而挖掘图像的高层语义。图像包与包之间、示例与示例之间的类别标记具有一定的相关性,在以前的图像检索技术中忽略了这种关联度。在对图像进行分类的时候,需要对这些对象添加标签。示例之间的学习过程,会引入一些与图片无关的类别标记。图像与图像之间的语义标记存在一种潜在语义,这种语义关系可以将几幅图片关联起来得到其高层语义。(3)首先对图像视觉底层特征数据进行处理,然后利用CK_MIML算法实现图像的分类检索。在第四章中首先对提取底层视觉特征向量包处理,利用K均值的聚类算法,从而得到聚类中心点。由这些聚类中心点就可以得正负包中示例稠密度点,利用稠密度点可以得到正示例。用包与聚类中心的最大距离、最小距离构成包的结构和正示例构成一个新的向量来描述图像,利用多核函数计算新向量之间的相似度,实现图像的检索。