论文部分内容阅读
互联网的迅速普及和基础设施的不断完善带来了电子商务的飞速发展。随着虚拟网络中的商品种类和数量急剧增加,如何向客户有效展示这些丰富的商品信息成为电子商务在智能化过程中遇到的重要问题。商品图像作为商品在互联网这个虚拟空间中最主要的信息载体,对其进行基于内容的自动分类能够为交易双方迅速检索商品信息、合理制定商品放置策略以及对客户进行个性化推荐提供帮助,从而提高电子商务市场的整体效能。本文在商品图像分类现有研究的基础上,借鉴通用图像分类算法,结合商品图像物体摆放位置居中、拍摄背景简单、细节信息丰富等特点,提出改进的基于内容的商品图像分类算法,具体工作如下:(1)针对商品图像的特点,将图像自适应地划分为具有大量商品信息的前景区域和缺少有用信息的空白背景区域。在前景区域中将具有明显局部特征的区域划分为特征区域,提取稀疏SIFT特征;将灰度变化较为平缓的区域划分为辅助特征区域,提取稠密SIFT特征;在空白的背景区域不提取特征点。采用SCSPM得到各区域的描述向量并根据融合函数进行连接并作为图像最终的描述特征。将这些特征输入支持向量机进行分类,实验结果显示使用自适应的融合SCSPM特征能比传统方法在商品图像分类上获得更好的结果。(2)针对传统SPM方法虽然记录了图像的空间位置信息,但不能体现视觉单词在特定位置所具有的分类能力的问题,本文提出一种基于熵的SPM空间加权方法。不同的视觉单词在不同类别出现的概率可能不同,根据信息理论可以利用熵的概念来描述不同单词的这种分类能力,因而在计算单词权重时融入视觉单词在该区域的分类信息能够进一步提高视觉单词的区分能力。(3)针对部分商品图像集使用单个SVM分类器分类准确率难以得到进一步提高的现象。本文提出一种以弱SVM作为AdaBoost算法分量分类器的多分类器联合决策方法AdaBoostSVM。依次训练一组分量分类器,在每一轮中给每个训练样本赋予一个权重,表明每个分量分类器对其关注程度,通过调整权重将分类器聚焦到更容易错分的那些样本点以获得更好的分类性能。本文利用MATLAB对商品图片分类过程进行模拟,实验结果表明该方法能够对商品图像进行有效分类,在实验图像集上平均分类准确率达到87%。