论文部分内容阅读
随着云计算、图像传输和网络技术的迅猛发展,网络上图片、视频等多媒体信息日益成为占据网络空间的主要内容。众所周知,海量的信息更需要有效的组织和管理,所以对大规模视觉信息的分类和检索的研究,己成为现阶段科研工作中亟待解决的问题。其中,网络图像分类受到越来越多的关注,并成为研究热点。早期的图像分类研究中,最根本的工作之一是如何准确的表达图像的视觉信息,而视觉信息的表达又依赖于如何更好的抽取图像的视觉特征。在研究工作中,我们通常把图像的视觉特征分为两个部分:局部特征和全局特征。这两种特征从不同角度分别描述的图像中包含的信息。近年来,在大规模网络图像分类研究工作中,相比于全局特征,局部特征鉴于其在图像噪声和物体遮挡方面的优势,因此受到了更广泛的关注。本文主要针对基于局部特征的图像分类工作展开研究,提出了结合用户信息的分类方法,期望通过与用户的交互,以改善在网络图像数据集中的分类效果。本论文的主要研究工作如下:1.提出了基于局部特征的图像分类和检索研究中的方法,并采用NUS-WIDE-OBJECT和MIRFLICKR-25000两个数据集验证了他们在网络图像分类和检索中的优势。与传统的局部特征相比,实验结果表明梯度直方图和颜色直方图检测子能够有效的提高分类和检索的准确率。2.提出了结合用户信息的半自动推荐算法。借鉴传统的图像分类的方法,利用已有群组中的图片作为训练样本获得分类器,并对测试集中的所有图像进行初始的预测。利用主动学习的方法,选择测试图像集中最具代表性的少量样例图像,提交给用户并分配到合适的群组中。因而,这部分少量的样本图像包含了用户所提供的信息。利用用户反馈获得的样例图像,通过多图的组群传播的半监督学习方法,获得测试集中剩余图像的群组信息。与传统的群组推荐的算法相比,该算法具有明显的优势:利用了用户提供的信息;最大程度上的减少了用户的大量的分配图片的工作,节省了用户宝贵的时间;直接采用了网络原始的Flickr数据集,图像数据内容更具有网络图片的特点。3.本文结合了用户信息、图像标注信息及视觉内容信息,提出了一种网络共享图像标注推荐的算法。本文提出的算法主要研究了以下几个方面的内容:利用贝叶斯概率数学模型表述了图像标注与视觉内容间的相关程度;利用对比的方法,展现了在全局特征、局部特征等多种特征相似性的条件下,标注推荐结果改善了网络图像原有的标注信息;利用大规模网络图像作为本文的实验数据,通过比较不同方法下的实验结果,验证了本文算法的有效性和可靠性。