论文部分内容阅读
高分辨率数码相机的普及和网络传输带宽的增加促进了数字化图像的大量产生和堆积。如何有效地管理与检索如此大规模的图像数据库已成为当前信息检索领域的重要课题。传统的基于内容的图像检索技术由于“语义鸿沟”不能很好地满足图像语义检索的要求。图像语义检索通过对图像建立文本索引可以提供用户友好的文本检索接口,其关键问题在于如何自动对图像进行语义标注。因此,图像自动标注是图像检索中重要而极具挑战性的工作。图像自动标注可以利用已标注的图像集自动学习底层视觉特征(比如颜色、纹理)与高层语义(比如自然风景、建筑物)之间的关系模型,并通过此模型标注未知语义的图像。将每个语义关键词看作一个类标签,我们可以通过使用多类分类技术实现对未知语义的图像进行标注。SVM以其良好的泛化能力被广泛应用与分类问题中,但是传统的SVM是基于两类分类的。目前解决多类分类问题的方法大多将其分解为多个两类分类问题,随着训练数据和类别的增多,这样处理时间开销将急剧增加。针对该问题,本文提出了两种改进算法:首先,提出一种新的解决多类分类问题的方法,称之为简单的多类支持向量机(Simplified Multi-class Support Vector Machine, SimMSVM),SimMSVM求解一个二次优化问题“一次性”实现多类分类,且通过引入一个简化的损失函数降低求解问题的规模。我们扩展SimMSVM将其用于图像自动标注,并有效提高了训练分类器和标注图像的速度。其次,我们将支持向量数据描述(Support Vector Data Description, SVDD)方法用于图像自动标注。SVDD通过建立包围目标类的超球来拒绝非目标类数据。该算法对每一类的样本数据单独构造超球,显著地降低了求解问题的规模和复杂度。SVDD可以很容易地处理多类分类问题,通过训练好的超球边界对未标注图像进行分类并实现语义标注。