论文部分内容阅读
随着互联网的推进和发展,人们越来越倾向于通过网络购物方式购买商品。在过去几年里,商品种类急剧增加,如何在海量的商品信息中方便快捷地找到想要购买的商品是一个急需解决的难题。传统的基于文本关键字的商品分类方法虽然方便快捷,但由于文本标注信息的片面性,容易出现错误分类。而商品图像蕴含丰富的信息与数据,且能够直观地展现商品的大部分特征。基于卷积神经网络的商品图片自动分类能够给顾客和商家提供更好的商品查询和检索体验,并有助于电商平台推荐商品。本文的主要研究内容如下:(1)针对常用激活函数relu在x负半轴的导数恒为零,导致训练过程中容易造成神经元“坏死”以及现有组合激活函数relu-softplus在模型收敛情况下学习率过小导致收敛速度慢的问题,设计并实现了一种新的组合激活函数relusoftsign。详细分析激活函数在训练过程中的作用,给出激活函数在设计时需要考虑的要点;根据这些要点,将relu和softsign函数于x轴正、负半轴进行分段组合,使其x负半轴导数不再恒为零。在MNIST、PI100、CIFAR-100和Caltech256数据集上的实验结果表明,使用relu-softsign组合激活函数提高了模型分类准确率,简单有效地缓解了神经元不可逆“坏死”现象;同时,加快了模型收敛速度,且在复杂数据集上,该组合函数的收敛性能更好。(2)Dropout是防止过拟合的一种有效方法,其设置的丢弃概率对该层所有神经元均起作用,使得部分有用信息被抛弃,导致模型的平均训练精度降低。针对该问题,本文提出了Sep-Dropout方法。首先对神经元进行重要度划分,分别存放在两个矩阵中,然后对重要神经元矩阵以较低概率置零,对不重要神经元矩阵以较高概率置零,最后对两个矩阵进行整合,有效地减少了重要神经元被丢弃的可能,从而提高分类准确率。在MNIST、PI100、CIFAR-100和Caltech256数据集上的实验结果表明,使用Sep-Dropout方法在防止过拟合的同时,与Dropout方法相比,具有更高的分类准确率。(3)在电商图片数据集上应用本文提出的relu-softsign函数和Sep-Dropout方法进行综合实验。首先分析电商分类领域的权威数据集图片特点,仿照其结构分别建立常见商品分类自建数据集和商品精细分类自建数据集,并做图像预处理。然后在PI100和两个本文自建商品数据集上进行实验,实验结果表明,在电商图片数据集上,使用relu-softsign函数提高了模型在训练集和测试集上的分类准确率,使用Sep-Dropout方法在达到防止过拟合目的的同时保证了训练集精度,使用结合relu-softsign函数和Sep-Dropout方法的模型在训练集和测试集上都获得了更高的分类准确率。最后,在PI100数据集上将结合了relu-softsign函数和Sep-Dropout方法的最终模型与其他研究者的电商图片分类方法进行对比实验,实验结果表明,本文方法的分类准确率更高,分类效果更好。