论文部分内容阅读
由于电子商务网站的成功发展,在线购物已经成为一种方便、快捷、廉价的购物方式,随之而来的是图像数据呈现几何级数增长,如何对如此超大规模的购物图像进行有效搜索成为近年来学术界和工业界的研究热点。目前Google和阿里巴巴等已经提供了查找视觉相似商品的搜索服务,但是这些搜索引擎由于对复杂背景的图像直接提取形状、纹理、颜色等的全局视觉特征而受到图像背景噪声的干扰,因此无法取得理想的搜索效果。为了提高购物图像的搜索准确度,必须去除图像的复杂背景,即提取出图像中的商品目标。本文针对包和衣服类复杂背景购物图像的商品提取问题,提出了与传统机器学习不同的检查方法,旨在用以提高购物图像的搜索准确度。本文的主要内容和贡献如下:第一,提出了购物图像主目标提取算法,该算法主要针对不含有模特的图像提取商品目标。购物图像虽然背景复杂却有这样的特点,商品目标一般被置于接近图像中心的位置,并且目标对象应该占图像足够比例以醒目。于是通过利用基于图的快速分割算法对图像对象的识别能力,以及主目标的空间位置分布特性和区域大小特性,本文提出了与传统机器学习不同的检测方法算法来获取目标对象。第二,提出了购物图像多目标提取算法,该算法主要处理含有模特的购物图像。购物图像中的模特一方面为商品提取增加了难度,另一方面也为找到衣物提供了线索。该算法首先利用人脸和肤色等的先验知识大致定位可能的衣物区域;接着根据高斯混合模型分析了图像的背景和衣物模型,并加入空间信息修正这些模型;最后根据模型准确地得到衣物。第三,实现了购物搜索系统。利用主目标、多目标提取算法去除购物图像的背景干扰后再提取图像的颜色、SIFT (Scale Invariant Feature Transform)特征,前台采用Grub Cut分割算法与用户交互,最后利用欧式距离和BoW (Bag of Words)分别匹配颜色和SIFT特征。通过实验一方面证明了两种提取算法的有效性,另一方面说明本文的搜索系统能提高购物图像的检索准确度。