论文部分内容阅读
在大数据时代,我们每天都会有数以万计的信息急需处理。作为一种直观的信息表达方式,图像早已普遍应用到各行各业中。如何快速且高效地实现图像分类是值得探究的热点问题之一。传统的人工分类需要花费很大的成本,分类效果也未必理想。通过计算机技术与图像分类技术的结合,计算机能够实现图像的识别与分类,这具有重大意义。在众多图像分类技术中,特征袋模型是一个常用的框架技术。它将图像看作特征向量的集合,通过特征提取、特征编码等步骤来表示图像,然后选取合适的分类算法完成分类工作。在对图像分门别类时,图像的特征是重要的分类依据。特征编码对图像表示和分类结果都有着重大影响,是图像分类技术的关键步骤。局部约束线性编码(Locality-constrained Linear Coding,LLC)是一种流行的特征编码方法。它充分考虑了特征的局部性。对于每个待编码的特征描述符而言,LLC算法会为其选取若干相近的视觉单词,组成对应的局部坐标系统,然后在局部坐标中重构该特征描述符。LLC算法有着良好的重构性、局部稀疏性和平滑性,因此在各个领域得到了重要应用。但传统的LLC算法在选取K近邻时,仅仅采用了欧氏距离作为唯一的度量标准,并不能很好地体现特征向量之间的相似性。除此之外,图像中不同区域包含的信息对分类效果有着不同程度的影响。LLC忽略了这一事实,在进行特征重构时,没有计算每个向量基的权重。根据上述分析,本文对传统LLC进行了改进,提出了基于混合相似度和加权基的局部约束线性编码(Locality-constrained Linear Coding Based on Hybrid Similarity and Weighted Bases,HSWLLC),具体工作如下:(1)欧氏距离和直方图相交都是衡量特征向量相似度的常用标准。尽管如此,欧氏距离并不能从本质上对向量进行很好的对比。因而,将欧氏距离作为唯一度量标准具有一定的局限性。直方图相交计算了两个向量在不同分量上的公有部分,很好地体现了向量间的相似性。因此,本文将两者结合起来,分配了不同的权重,提出了混合相似度(Hybrid Similarity)。(2)为了充分利用图像中的重要信息,更好地体现不同区域对分类结果的影响,本文为向量基赋予了不同的权值。为待编码特征选好局部向量基后,我们对它们的权重进行了规范化处理,求得所选向量基在局部坐标中的权重值。除此之外,在进行特征重构时,本文加入了非负限制,以提升算法的稳定性。为了验证本文算法的性能,我们在三个常用的数据集上进行了实验,将本文方法与其他方法进行了对比分析,并且研究了部分参数对于分类结果的影响。实验结果表明:本文算法不仅提高了分类精度,还提升了编码的稳定性。