论文部分内容阅读
随着计算机科学技术的快速发展,人们获取和发布信息的能力和渠道得到了极大的提升和拓展。海量的数据在极大丰富人们资讯的同时,也给信息的组织、查找和分析带来了挑战。有效的图像内容理解技术己成为众多应用领域的迫切需求。属性作为一种沟通底层特征与高层语义的中间桥梁,已经被广泛应用到目标识别、图像分类、检索等多个领域。属性包括二值属性和相对属性。二值属性对图像的描述具有局限性,不能精确地描述图像的内容,而相对属性是对二值属性的一种扩充和细化,刻画了一种视觉性质的强度谱,提供了图像目标较准确的信息。例如,在自然图像的描述中,哪个场景是“更开阔的”;在商品图像描述中,哪件商品是“更休闲”的。提高相对属性学习的精度,奠定其在应用中的基础,是目前的研究热点。本文主要围绕相对属性学习中图像对的标签信息挖掘和关键特征保留两个方面,进行了如下研究:(1)在相对属性学习时,需要图像对的标签信息。但是,在现实情况中,图像对的标注是一个费时费力的过程。针对标签信息少的情况,本文提出了一种基于组稀疏的半监督相对属性学习方法,可以自动地挖掘图像对的标签信息。首先,少量的标注样本按照属性的强弱被分组,并作为组稀疏学习中的字典。然后,对未标注的样本进行稀疏分类。半监督学习的过程就是在每次迭代中,挑选出重构误差最小的未标注样本,按照组之间的相对关系,生成图像对的标签信息,加到模型中。本文在三个公开的数据库(OSR、PubFig、Shoes)中验证了方法的有效性,并和主动学习方法进行了比较。实验表明,本文所提出的方法在效率和精度方面有一定的优越性。(2)在相对属性学习时,需要利用提取的特征,但是特征中存在着不利于属性学习的信息,不是每一维的特征对相对属性学习都起到了正面作用。针对这个问题,本文提出了一种基于重排不等式的关键特征保留方法。本文假设,用关键特征学习的模型和用原始特征学习的模型对图像样本的排序是基本吻合的。基于这个假设,本文建立了关键特征保留方法的数学模型,并对模型进行了求解。本文在三个公开的数据库(OSR、 LFW-10、UT-Zap50K)对所提出的方法进行了验证。实验表明,与原始特征相比,不管是单个特征,还是多个特征的级联,利用所保留的关键特征可以提高相对属性学习的精度。