论文部分内容阅读
随着计算机网络,存储压缩技术的发展以及智能移动设备的普及,视觉信息大量涌现,呈现海量特征,如何对海量视觉信息数据进行有效地组织,管理以及检索,成为了科研以及商业领域急需解决的问题。语义清晰是大规模视觉信息管理的前提和基础,因此根据视觉信息数据的语义标注研究具有十分重要的理论以及实践意义,吸引了越来越多的研究人员的目光,成为了当前的热门研究方向。早期的视觉信息标注依靠人工来完成,人工标注费时费力,无法满足海量视觉信息的标注要求,促使研究人员寻找新的标注技术,以期来实现自动标注。视觉信息语义的自动标注本质上是一个根据视觉内容推导出语义标签的学习过程,机器学习技术由于在理论和实践领域都比较成熟,可为语义标注提供理论支持以及可能的解决方案,逐渐成为当前解决视觉信息语义标注问题的主流方案。图像作为最普遍的视觉信息数据类型,图像语义标注是视觉信息标注领域最重要和最热门的方向之一。当前机器学习的视觉信息标注在取得一定发展的同时还存在一些函待解决的问题:样本缺乏,视觉数据歧义性以及语义概念间的关联性挖掘,现有算法的标注性能还有待进一步提高。多示例学习是公认的解决数据歧义性的主流途径,由于图像标注本身是多标签问题,因而我们选择在多示例多标签框架下对该图像标注问题进行研究。本文在深入研究多示例多标签学习框架的基础上,将一种新的标签相关性引入到多示例多标签学习框架中来,用于解决图像标注问题.本文的主要研究内容:考虑到传统的多示例多标签框架忽略了标签相关性,或者是将标签相关性作为全局概念知识加以利用,我们将局部标签相关性引入到MIML_SVM多示例多标签学习框架中来,得到了一种新的多示例多标签学习算法MML_LC_SVM。将标签相关性作为局部知识概念加以利用,更加符合视觉信息数据的自身特点,基于Corel图像数据库上的实验结果表明,MIML LC SVM算法具有良好性能。