论文部分内容阅读
最近在图像处理领域,基于对象的分类和检测是一个很好的课题并且有非常广泛的研究领域。对象分类包括两种类型,一种是基本分类,另一种是精细分类。对象的精细分类对于研究人员来说是一项非常具有挑战性的任务。对象的精细分类是属于同一个基层分类(如不同的鸟类)并且拥有相似的外形或视觉表象。相同的鸟类,有不同的定位点,不同的鸟类可以有相同的定位点和表象,这都给分类研究增加了困难。 论文使用了有200多种鸟类的Caltech-UCSD鸟类数据集,应用词袋模型为基本的核算法,论文应用高效匹配核算法结合空间金字塔和主分量分析来进行精细分类。最后的分类器使用支持向量机。 基于尺度不变特征变换在基本分类任务中的卓越性能,选其作为基本的检测器。K均值聚类后,画出每幅图像的直方图。高效匹配核是一种快速算法,核函数引导基于平均映射函数的两幅图的匹配,而不是图像中每一点的匹配。当与空间金字塔结合后,位置信息和直方图信息会在匹配过程中得到表达。由于对一幅图像来说,上述步骤会产生一个高维空间,因此我们希望在不改变性能的情况下进行降维。在空间金字塔之后,我们应用主分量分析方法。 实验结果表明,精细分类中,结合空间金字塔的高效匹配核算法在Caltech-UCSD鸟类数据集的实验中,比词袋模型算法得到的结果更好。结合主分量分析之后,维数将会从63000降低到1524。