基于CNN的图像分类及在电商图片分类中的应用研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:liuqingq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的推进和发展,人们越来越倾向于通过网络购物方式购买商品。在过去几年里,商品种类急剧增加,如何在海量的商品信息中方便快捷地找到想要购买的商品是一个急需解决的难题。传统的基于文本关键字的商品分类方法虽然方便快捷,但由于文本标注信息的片面性,容易出现错误分类。而商品图像蕴含丰富的信息与数据,且能够直观地展现商品的大部分特征。基于卷积神经网络的商品图片自动分类能够给顾客和商家提供更好的商品查询和检索体验,并有助于电商平台推荐商品。本文的主要研究内容如下:(1)针对常用激活函数relu在x负半轴的导数恒为零,导致训练过程中容易造成神经元“坏死”以及现有组合激活函数relu-softplus在模型收敛情况下学习率过小导致收敛速度慢的问题,设计并实现了一种新的组合激活函数relusoftsign。详细分析激活函数在训练过程中的作用,给出激活函数在设计时需要考虑的要点;根据这些要点,将relu和softsign函数于x轴正、负半轴进行分段组合,使其x负半轴导数不再恒为零。在MNIST、PI100、CIFAR-100和Caltech256数据集上的实验结果表明,使用relu-softsign组合激活函数提高了模型分类准确率,简单有效地缓解了神经元不可逆“坏死”现象;同时,加快了模型收敛速度,且在复杂数据集上,该组合函数的收敛性能更好。(2)Dropout是防止过拟合的一种有效方法,其设置的丢弃概率对该层所有神经元均起作用,使得部分有用信息被抛弃,导致模型的平均训练精度降低。针对该问题,本文提出了Sep-Dropout方法。首先对神经元进行重要度划分,分别存放在两个矩阵中,然后对重要神经元矩阵以较低概率置零,对不重要神经元矩阵以较高概率置零,最后对两个矩阵进行整合,有效地减少了重要神经元被丢弃的可能,从而提高分类准确率。在MNIST、PI100、CIFAR-100和Caltech256数据集上的实验结果表明,使用Sep-Dropout方法在防止过拟合的同时,与Dropout方法相比,具有更高的分类准确率。(3)在电商图片数据集上应用本文提出的relu-softsign函数和Sep-Dropout方法进行综合实验。首先分析电商分类领域的权威数据集图片特点,仿照其结构分别建立常见商品分类自建数据集和商品精细分类自建数据集,并做图像预处理。然后在PI100和两个本文自建商品数据集上进行实验,实验结果表明,在电商图片数据集上,使用relu-softsign函数提高了模型在训练集和测试集上的分类准确率,使用Sep-Dropout方法在达到防止过拟合目的的同时保证了训练集精度,使用结合relu-softsign函数和Sep-Dropout方法的模型在训练集和测试集上都获得了更高的分类准确率。最后,在PI100数据集上将结合了relu-softsign函数和Sep-Dropout方法的最终模型与其他研究者的电商图片分类方法进行对比实验,实验结果表明,本文方法的分类准确率更高,分类效果更好。
其他文献
具有我国自主知识产权的3G标准TD-SCDMA使用了多种先进技术,为我国移动通信产业的发展带来了巨大的契机,是向第三代过渡的首选技术.该文先介绍TD-SCDMA的标准化历程,然后重点
<正> 为了监测上海石化总厂污水处理厂氧化塘所排放的污水质量,我们对污水毒性比较敏感的花、白鲢鱼种和对污水毒性忍受力强的鲫鱼鱼种做了一次试验,藉以了解经过处理行将排
本文将网络技术和数据库技术相结合,介绍如何利用网络和数据库进行卫生调查。
目的:我们通过Gene Expression Omnibus(GEO)数据库分析发现AGR3(Anterior Gradient protein 3)在ER(Estrogen Receptor)阳性乳腺癌(Breast cancer,BC)组织中的表达显著高于其在ER阴性乳腺中的表达,然而AGR3的功能和机制在乳腺癌却未见报道。本研究的目的旨在研究AGR3在ER阳性及ER阴性乳腺癌及个乳腺癌亚型中
新生隐球菌是进化最为成功的环境致病真菌之一,每年造成约60万人死亡。在侵染宿主或受到特定环境胁迫时,该致病菌能够展现高度社会性:不同细胞形态共存且能够应答于胞外信号
团头鲂是一种优良的淡水鱼类,为提高鱼苗饲养成活率,对其早期消化顺官的发育进行了观察。鱼苗孵出后第1天至第3天,消化道呈直管形,管壁由单列细胞组成,口裂未形成,肛管不与外界相通,营
产细菌素的干酪乳杆菌(Lactobacillus casei)CAU112对动物具有益生效应。本文尝试了一种新的微胶囊包被的方法以提高CAU112在动物消化系统中的存活率。通过实验发现,海藻酸钠
该文介绍了频率合成技术的发展历程,着重综述了当前国内外快速频率合成的方法及其技术水平,并指出了频率合成技术的未来发展方向。
<正> 前言中华绒螯蟹Eriocheir sinensis广泛分布于中国东南部沿海咸淡水或淡水水域中,具有很高的经济价值;其产卵涸游高峰在每年秋冬季节。通过人工授精及孵化,对中华绒螯蟹