论文部分内容阅读
近年来,网购平台(如亚马逊,淘宝等)蓬勃发展,大量互联网用户选择在线网购作为重要的购物方式。网购平台为提升用户购物体验,将图像作为商品展示中不可缺少的一部分。这同时也为网购平台成功积累大量的商品图像。网购平台中海量商品图像的出现,为更好地组织、检索和查看商品创造可能。例如,用户可以通过一幅简单图像,查找相关的商品。然而,这并不是一项简单的工作,因为低层次的视觉特征和真实世界的商品之间有着巨大的区别。因此,如何预测一幅图像中商品的类别,成为一个重要的问题。事实上,商品图像类别预测基于图像分类的方法。但与传统的图像分类应用相比,商品图像类别预测问题不但需要利用海量社会化标注的图像,更需要对现实世界中商品的海量类别进行预测。本文为构建一种完整的商品图像类别预测方法,提出数个具有良好扩展性、适用于大数据处理的算法和模型。在这种自动化方法中,利用易于从互联网获得的社会化标注图像是基础。然而,这些数据中图像与他们类别标签间的关系存在不确定性,这导致从图像搜索引擎获得的图像中总有不相关图像存在。过滤这些不相关的图像是一个大规模数据的单类别预测问题。为解决该问题,本文采用一种基于图分割和KNN分类算法的模型。为描述大规模商品图像数据,本文选取视觉词包特征作为图像多类预测任务的特征。然而,经典的聚类算法无法解决海量视觉兴趣点条件下视觉词典的训练问题。为解决该问题,本文提出一种加速的K-means算法。在这种算法中,三角形不等式被用于减少冗余计算。而Hierarchical K-means算法则被用于选取更佳的K-means算法初始中心点。为解决类别数目特别巨大时的类别预测问题,本文提出一种多类预测模型。针对预测模型中基础的两类分类问题,本文研究选用χ2-RBF核的SVM分类器。而为完成最终的多类预测任务,本文设计并提出一种基于双败思想的层次预测方法。基于上述模型和算法,本文提出的商品图像类别预测方法具有优秀的时间性能,在大规模商品图像数据应用中具备可行性。另一方面,在商品图像数据集上的实验,成功验证本文所提出图像类别预测方法的有效性。