基于Drop Weight算法在神经网络正则化中的研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:wareware1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在神经网络当中,为了进一步提升网络模型的表达能力,提取出输入信号更高级特征,神经网络的结构有着变得更深更宽的发展趋势。与此同时,更深更宽的网络会带来大量的权重参数需要被训练,特别是当训练数据不充足时,数百万个权重参数被训练时,很容易使得网络出现过拟合。因此,防止过拟合的有效方法的提出迫在眉睫。过去,通常会采用训练多个模型做组合的方式去防止模型出现过拟合,但这会导致模型训练和测试的过程非常耗时。目前,往往会采用了大量的正则化方法来提高神经网络的泛化能力,比如来L2正则化、Batch Normalization、Dropout、Dropconnect等正则化方法。其中,Dropout算法在训练的过程中,随机地选择忽略一定比例神经元节点的响应,使得网络权重的更新不再取决于有固定节点的联合作用。但是它对隐含层的神经元们判断是否激活是具有具有一定的随机性,并且让失活的神经元不能同时参与权重的更新,从而忽略了神经元的作用能力有强有弱的局限性。本文针对Dropout算法的局限性,对未被激活神经元们被赋予较小的激活程度值做出了相关研究,提出了一个新的神经网络正则化方法--DropWeight算法,以进一步提高模型的防止过拟合能力,从而达到增强模型的泛化能力的目的。它通过伯努利分布按一定的概率随机选择在全连接层当中的神经元节点是否被激活,然后引入一个神经元激活程度值变量,为未被激活的神经元们赋予较小的激活程度值,增加网络训练时连接方式的复杂度,使得每次网络权值更新可依靠作用能力有强有弱的隐含节点。通过对Mnist和Cifar-10两个标准图像数据集,在多层感知机和卷积神经网络等网络上进行图像分类的实验。结果表明,当各个网络在全连接层上使用DropWeight算法时,不仅每个网络都可以找到一个固定的最优激活程度值-0.4和一个固定的程度值变量的调优取值范围[-0.5,-0.1],而且相比使用No-Drop、Dropout等算法,在提高网络分类识别率、降低网络过拟合比率等方面上,DropWeight算法展现出了的一定的优越性。DropWeight算法不仅进一步提升了模型的防止过拟合的能力,而且也提高了模型的学习表达能力,从而增强了整个网络模型的泛化能力。
其他文献
近代中国可谓文化冲突中的中国。值此中西碰撞、新旧交替之际,留学生是最先走出国门、直接沐浴欧风美雨洗礼、接受世界文化与域外新知的知识分子群体。而胡适、吴宓无疑是留
美术课程强调通过发挥美术教学独特的魅力,根据学生的情感和认知特征,不断实验与完善生动的教学内容和教学方法,激发学生的学习兴趣,并使这种兴趣转化为持久的情感态度。随着
从上世纪90年代以来,大规模人口流动就已经成为社会关注的热点话题。伴随着我国社会不断转型与发展,无论是人口流动的规模还是内部结构都已经发生了重大改变。人口流动方式从
现代医学逐渐发展到了数字医疗和精准医疗的阶段。医学影像提供的相关信息为手术的规划和实施提供了帮助,但也存在新的挑战。首先,对于术前影像的查看与手术规划目前只能在图
在全民健身的背景下,马拉松赛事蓬勃发展,随着赛事的增多,各种风险事件也层出不穷,尤其是近年来马拉松比赛中频繁出现运动损伤和猝死等突发现象。马拉松运动是一项高强度、耗
蒙古国为亚洲中部国家,1921年前蒙古国境内没有正规的学校,只有私塾、社团等仅为贵族阶级提供培训的学校,而民众接受教育的方式只有家庭教学和宗教传播,文盲率非常高。1921年
自从人类社会步入信息化、数字化的时代,信息的传播与共享仿佛开上了快车道,在人们传统生活方式受到挑战的同时,信息安全也成为人们无时无刻不在关注的话题。随着通信技术的
叶剑英是我中华人民共和国的开国元勋,坚定的马克思主义者,伟大的无产阶级革命家、政治家、军事家,中国人民解放军的缔造者之一。长期担任党、国家和军队重要领导职务的卓越领导人,中华人民共和国十大元帅之一。叶剑英亲自参与并见证了中国人民军队从创建到发展一直到现代化建设的全过程。在指导中国人民军队建设发展的过程中,将马克思主义军事思想与我国军队发展现状充分结合,从实际出发提出了一系列重要的军事思想,丰富和发
轴棱锥(Axicons)是一种能够将轴上点源发出的对称光线偏折形成一条沿轴向分布的连续线段的旋转对称光学元件,具有轴向线聚焦性质。贝塞尔光束具有无衍射特性,是无衍射光场中
软件工程要解决的核心问题,简单地说就是如何以最小的代价生产出最大效用的软件。解决该问题的基本途径之一,是研发具有高度灵活性和扩展性等特点的可复用软件及方法,其中框