论文部分内容阅读
网络社交图像共享网站例如Flickr(?)Zooomr允许用户分享自己的多媒体信息以用来社会化交换。这些服务的一个重要特点是用户手工对他们的图像标注关键字标签,并用这些标签作为索引关键字进行图像搜索和其他应用。但是,由于这些标签通常是由不同背景的互联网用户提供的,它们与图像的真实内容之间存在着偏差。这严重影响了基于标签的多媒体应用并对多媒体研究提出了新的挑战。围绕互联网社交图像标签存在的问题,本文展开一系列工作来处理和分析社交图像的标签信息,尤其是使用基于内容的图像分析技术来提高标签相对于图像内容的描述能力,并获得精确可靠的标签标注结果。我们充分尝试利用互联网上丰富的图像数据、用户的群体知识信息、词汇的语义知识库等信息源,结合机器学习、计算机视觉和信息检索等方法,对互联网社交图像标签和基于标签的一系列应用问题进行了深入的研究。本文的主要成果和创新包括以下几点:·提出了标签排序这一研究问题,提出一种基于图像内容的自动标签排序算法来将图像的标签赋予不同的相关度。具有不同相关度的标签有助于提高基于标签的视觉信息搜索并提高基于标签的应用问题的相关性。·提出社交图像标签修正问题。提出了一种系统的标签修正算法,充分体现了用户,数据和图像特征的相互关系。在此基础上进一步提出一种协同标签修正算法,其针对每一个标签建立一个图像相似图,并利用标签之间的语义相关性将不同标签的修正过程耦合在一起,该方法不仅提高了标签的质量,同时形成了一种新的基于多图的多标签传播算法,丰富了基于图的半监督机器学习技术。·提出一种能够描述图像之间多种关系的多边图结构,其中每条边连接图像之间相似的两个局部区域。通过在该结构上进行标签传播,实现了图像的区域标注。这不仅得到了更细粒度上的标签信息,也进一步提高了基于内容的图像检索系统的可靠性。我们进一步将该多边图结构扩充为异构多边图,使得其可以接受多种异构底层特征为输入。提出了一个核心关系式来实现多边图和异构多边图上的标签传播,丰富了基于图的机器学习技术。·提出一种半自动的相册标注方法以方便用户进行相册图像的标注。这种标注方法能够在标注精度和用户的手工代价之间得到一种平衡,并能够根据用户的个性化需求动态地调整系统的标注精度。