一种像素随机迁移扩充小数据集的训练方法

来源 :福建师范大学 | 被引量 : 0次 | 上传用户:Liu234449171
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国内外专家学者对图像识别领域研究的不断深入,图像多分类任务、图像内多目标识别以及图像分割技术已经取得了长足的发展,传统领域有Gabor特征,SIFT算子,LBP算子等方法,深度学习领域有Res Net网络模型,Google Net网络模型等,其中一些算法已经被运用到日常生活当中。由于网络的普及,巨量数据可以被轻易获得。因此,对数据量要求较大的深度学习识别方法的表现越来越好,准确率远超过传统识别算法,且鲁棒性和泛化性能更佳。但是,在训练神经网络时还存在以下问题:在数据集样本缺乏或者每类样本间的比例失衡时,样本无法覆盖整个特征空间。这将导致深度学习识别算法的准确率急剧下降。在这种情况下,需要一种使用小规模数据集进行训练的方法来提高模型的准确率和鲁棒性。因此,本文提出了一种采用小规模数据集训练神经网络的方法:基于高斯核函数的像素随机迁移扩充方法。结合目前常用的样本扩充方法,合理的将样本扩充到完成训练所需的数据规模大小,解决了当样本数量不足时无法支撑深度神经网络训练的问题。本文的工作主要有以下三个方面:1、针对样本数量不足,无法完成深度神经网络训练的问题,提出了一种基于高斯核函数的像素随机迁移扩充方法。该方法主要根据高斯核函数的正态分布来随机迁移像素点的位置以完成样本的扩充,能够对所收集的样本特征进行一定程度的变换和重构,相比常规方法能够更加有效的覆盖到更完整的特征空间。在进行训练时,能够使网络能够学习到更加多样的特征,从而增加模型的鲁棒性和泛化能力。2、采用MNIST和CTW数据集进行算法验证:在保证每一类别样本的数量均衡的前提下进行模型的训练,然后比较训练原始数据集和扩充后的数据集的训练结果。实验结果显示,只选少量样本扩充后的数据集训练的网络与大量原始数据集训练的网络的收敛周期、准确率、误检率较为相近,表明扩充方法模拟原始样本真实有效。3、提出一种小目标的候选区域提取方法,结合像素随机迁移方法构建出小目标识别系统,并将其运用到生产生活中:布匹缺陷检测。采集一定数量的原始布匹缺陷样本后对该样本集进行扩充,将扩充后的样本和原始样本分别输入到网络结构中训练得到模型,并对模型的测试结果进行统计。经过统计和比较后的数据显示,采用本文扩充数据集方法训练出来的深度学习模型在提升准确率,降低误检率上有显著的提升,且鲁棒性较好。
其他文献
通过重新解读文化相对论,本文认为文化作为一个整体是不可评价的,因为每个文化综合体都有其价值所在。然而,构成文化这个复杂体的文化要素却是可以识别的,同时也可以对其进行价值判断。本文选择文明作为评价文化要素是否为先进文化要素或落后文化要素的标准。文明因其带有先进属性及其多样性成为评判标准的一种选择。埃利亚斯·诺贝特在其著作《文明的进程》中以西方文明行为变化为线索探究了西方文明进程。他认为人与人之间的竞
在室内跑步机上进行锻炼不受季节天气影响并且简单高效,已成为大学生的一种重要健身方式。当前市面上的跑步机大多提供了一些运用领域知识构建的可选运动方案为运动者在锻炼健身时提供一定指导。但仍缺乏面向大学生并充分考虑其身体机能特点的个性化锻炼健身指导方案。如何在保证锻炼安全的前提下,有效提高大学生在跑步机上锻炼健身的效果已成为一个重要的研究问题。针对这一问题,本文研究并提出一种面向大学生的跑步机锻炼健身指
从本质上来说,微格教学是一个通过师范生的反思性实践来实现教师专业能力发展,尤其是学科教学实践能力发展的过程。但目前的微格教学过分强调表达能力、板书能力等教师基础能力的发展,却忽视了师范生对教学实践过程的反思。对师范生的授课实践开展有效的评价是微格教学取得成功的关键,但教学设计方面的疏失、有限的课堂时间和缺乏系统的评价工具,使得师范生的授课实践无法得到充分地讨论和评价,进而导致微格教学的效果不尽人意
自从纪录片问世以来,人物纪录片一直都是纪录片选题的重要题材之一。从“纪录片之父”弗拉哈迪创作的第一部纪录片《北方的那努克》,到后来初步发展时期的格里尔逊的《飘网渔船》,西班牙卡瓦尔康蒂的《煤矿工人》、日本小川绅介的《三里冢》系列以及美国梅索斯兄弟的《推销员》等,都将纪录片主题聚焦到了“人”的身上。20世纪90年代,内地纪录片《流浪北京》的出现,也将人物纪录片推向了新的发展阶段。同时,随着纪录片的发
本研究从福建宁德、三明和南平地区采集野生金线莲,分离并鉴定与其共生的菌根菌种类;选取R11(Fusarium concentricum)菌与金线莲组培苗建立共生体系后在薄膜温室进行培养,观察并测定金线莲生长情况;应用高通量测序技术对接种R11菌的金线莲组培苗进行转录组测序,通过基因表达变化的情况来探究菌根真菌对金线莲生长的影响。实验结果如下:(1)从福建省三个地区健康的野生金线莲植株根系分离到了1
集中统一性是中国共产党作为马克思列宁主义政党所具备的组织属性,也是必须随着革命形势变化而持续锻造的组织特性。锻造集中统一性与反对分散主义是个一体两面的实践过程,因而是考察中国共产党百年奋斗过程和自身建设历程的一条重要线索。本文尝试循着这一线索,考察党在新民主主义革命时期锻造这一组织特性过程中所呈现的历史面相,并总结反对分散主义的历史经验。本文共分为三章。第一章描述分散主义的表现,探究其存在的原因。
加强村级档案管理工作,对于服务新形势下的农村工作、推动乡村振兴战略的实施、保护农村历史文化遗产等具有重要意义。2018年1月,《村级档案管理办法》正式实施,作为我国第一部专门针对村级档案管理的国家级政策法规,对村级档案工作具有重要指导作用。《村级档案管理办法》的出台掀起了村级档案管理的实践探索热潮,以实践案例为基础形成的研究成果日益丰富。近年来部分学者对于“村档村管”、“村档镇管”两种管理模式的适
刺激隐核虫是一种能寄生于几乎所有海水硬骨鱼的遍身性纤毛虫,常寄生于鱼体表及鳃内,严重感染时常造成爆发性流行病,给海水经济鱼类养殖带来了巨大的危害,目前尚无安全有效的防治方法。有研究表明,寄生虫的半胱氨酸蛋白酶在其整个生活史都发挥着重要的作用,可能作为防治寄生虫病的靶点之一。在前期工作中,本人所在研究室从刺激隐核虫的c DNA文库中筛选了刺激隐核虫的木瓜蛋白酶样半胱氨酸蛋白酶基因(简称类木瓜蛋白酶,
我国台湾地区因《图书馆法》与《身心障碍者权益保障法》的修订,公共图书馆对于残障读者服务更加关注。目前我国台湾地区有关残障人士权益的法律法规较为完善,力求为残障人士寻求自由、平等的信息服务。公共图书馆作为文化信息的传播者,有义务提供信息以及服务给残障人士,以满足其基本的信息需求,从而缩小与普通人之间的信息鸿沟。《公共图书馆宣言》表明:每个人都不应受到年龄、种族、性别、宗教信仰、国籍、语言或是社会地位
上世纪七十年代以后,视觉追踪算法取得了很大的进步,多目标跟踪(Multiple Object Tracking,MOT)就是其中一个研究热点之一。按初始状态分类,多目标跟踪算法主要分为两类:基于检测的跟踪(Detection-Based Tracking,DBT)和基于初始化帧的跟踪(Detection-Free Tracking,DFT)。按照处理方式分类,多目标跟踪算法也分为两类:在线(Onl