论文部分内容阅读
本文针对内容为特定类型物体的图像,讨论其适用于基于内容检索的多种特征,提出了通过多特征融合和结果重排的检索方法,并以人脸为例实现了一个检索系统。本文的主要研究成果及创新点有:首先,从图像中抽取颜色、纹理、形状等含有多种信息的视觉特征、从多个角度描述物体;接着,利用直方图统计、聚类、信息增益等方法,从各个特征中选取出最具判别力的子集,给出了针对检索的特征改造方法,使其能迅速降维、同时仍能有效表征图像内容;然后,通过多特征融合方法将这些改造后特征的距离相结合、迅速过滤整个数据集,得到与检索图像最可能相似的备选集;最后,以精确特征重新排序,得到数据库中与查询图中人物在长相、装扮、神态上最为相似的图片。随着物体的类型被限定,图与图之间的差异性急剧减小。为此,本文讨论了多种特征在体现这些细微差异之时所能起到的不同作用,给出将其相互融合、共同表征的公式,并提出了通过实验确定各项权重参数的方法。另一方面,特征种类及维数的增加将导致检索效率的下降。对此,本文采用了兼顾效率与精度的过滤和结果重排方法。此外,我们还针对该明星脸检索系统,提出了评判检索结果优劣的方法:对单个结果从头发、脸型、表情等多方面进行评分,修正了第k位正确率(Precision@k)、平均正确率(Average Precision)、平均正确率均值(mAP)的定义。我们根据福布斯排行、从因特网上搜集了大量名人图片组成数据集,并设计、进行了大量实验,分析实验结果数据的精度和时间消耗后证明:该系统能提供精准的检索结果,具有优越的平均正确率均值(mAP),且有效缩短了检索等待时间。