论文部分内容阅读
随着互联网技术的迅猛发展,图像分类技术得到了飞速发展,其中较为热门的是词袋模型和可伸缩词汇树,通过将图像特征量化为视觉单词的方式达到分类的目的,具有很好的分类效果。但是,其中也存在着特征表达能力不强,聚类效果不稳定,特征表征不明确等问题。因此本文针对词袋模型和词汇树中的一些不足,进行了如下工作:(1)为提高词袋模型特征提取模块的特征表达能力,研究并实现了基于多特征融合的空间金字塔词袋模型。首先通过小波分析技术给DenseSIFT特征添加多尺度信息,并且在特征编码阶段使用空间金字塔模型增加特征之间的空间位置信息得到特征向量,然后融合颜色信息提高图像表达能力。最后在图像分类标准数据集上对本章的方法进行了不同特征、不同单词数量之间的对比实验,实验结果验证了该模型具有较高的分类准确率;(2)针对传统K-means算法过于依赖初始聚类中心且存在一对一硬化分的问题,提出了基于KSVD_MD的词汇树图像分类方法。首先,使用最大距离法选定初始聚类中心,并应用于K-SVD中实现特征聚类,通过将特征划分到多个类别进行加权表示,提高分类精度。然后,介绍了词汇树构建步骤及算法流程。最后,在标准数据集上进行实验,通过与其他算法的对比实验发现本章算法有效提高了分类准确率,相比于传统词汇树算法分类准确率提高了17%。(3)将多特征融合算法与KSVD_MD相结合用于词汇树分类模型中,并将此模型应用于瓶子商标分类中。对于商标这一类特殊图像,由于商标之间存在一代二代的关系,图像之间相似度极高。为了充分利用图像中的信息并达到高分类准确率,首先利用改进的词汇树对瓶子商标进行分类实验,但是该算法最终只能达到95.5%的分类精度;然后在词汇树分类基础之上,结合OCR文字识别技术进行重排序,最终达到了99.5%的识别精度,并且从旋转、噪声、遮挡多个角度验证了分类模型的鲁棒性较好。多特征融合主要将改进的多尺度DenseSIFT与颜色信息进行特征后融合,得到加权特征;KSVD_MD算法则在K-SVD的基础之上采用最大距离法确定初始聚类中心,用以增加聚类稳定性。两者相结合构建的词汇树结构在瓶子商标数据集上取得了优良的分类效果。