论文部分内容阅读
服装图像检索是传统图像检索技术与电子商务相结合的新兴领域。近年来,随着用户在电子商务网站上购买服装这一消费行为的日趋流行,以及服装类电子商务的蓬勃发展,服装图像检索技术是目前活跃度较高的一个研究热点。传统的图像检索技术十分成熟,但是直接运用在图像数量规模庞大的服装类电子商务领域仍然存在不少问题。既要避免人工标注图像的巨大工作量,要保证浏览器前的用户在失去耐心前得到检索结果,又要保障检索的准确率足以激发用户再次使用的欲望,这些都是服装类电子商务对图像检索技术的基本要求。本篇论文针对以上情况,研究和实现了一个服装图像检索系统,主要内容包括:提取三大CBIR特征、提取尺度不变特征兴趣点、对特征点聚类、基于词袋模型构建统一描述符。提取三大CBIR特征是就服装的颜色、形状、纹理特征展开研究,分别以RGB颜色统计直方图、Canny边缘检测算子、Tamura纹理描述算子对服装图像提取底层特征,并做了相关实例演示。在尺度不变特征点的检测方面,首先多次运用滤波函数对原图像进行滤波处理,构造平移不变、尺度不变的尺度空间,随后利用导数在尺度空间找出所有的极值点,最后在精度上加大限制,减小适应范围,剩下的就是稳定的特征点。考虑到SIFT算法复杂度高且运行时间较长,本文采用改良的SURF算法用以提升效率。特征点聚类,是对服装图像数据集检测所有尺度不变特征点,对全部特征点的SURF向量描述进行聚类的过程。采用的是在数据挖掘领域十分成熟的无监督学习算法,即K均值算法。特征点聚类,是对无序的局部特征点的归一化处理。词袋模型将每一幅图像都使用统一的频率直方图来表达,频率分量是前面使用聚类算法得到的聚类中心。最后,本文根据这些算法编写了Ocr服装图像检索系统。并以淘宝网上采集的多个类别共计10000张服装图像为实验对象,对系统进行了性能分析和验证。通过实验分析了不同K值以及不同检索返回数目N值下的系统查确率,并与传统三大CBIR特征进行了对比实验,实验数据表明本文提出的算法能够得到优于传统特征的查准率,取得更好的效果。