基于神经网络的小样本图像分类方法研究

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:furong2599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习背景下少量样本的图像分类方法是目前计算机领域中的一个重要问题,在实际应用中,通常数据采集困难且标注成本巨大,而深层神经网络包含大量的参数,当训练样本数据量较小时,假设空间中复杂的决策面使模型拒绝稍有偏差的样本,容易导致模型过拟合而影响分类精度。为了缓解过拟合,本文研究如何从少量样本中学习到足够的知识并建立一个泛化性能优异的模型,分别从大数据集至小数据集的迁移学习、神经网络损失函数以及针对小样本的神经网络模型集成三个方面来开展基于神经网络的小样本图像分类方法研究,主要工作如下:(1)研究如何将从大数据任务中学习到知识的模型迁移至小样本分类任务中。由于小样本数据集中数据量不足,容易导致模型训练不充分而使分类性能不佳的问题,本文基于迁移学习思想,研究如何将在大数据集上预训练的模型调整后应用于小样本数据特征的提取,节约训练时间并充分利用模型已经学习到的属性及泛化表示,提取到有用特征。(2)提出一个应用于小样本图像分类的神经网络损函数。深度神经网络模型提取图像特征时由于相似类别间容易混淆,难以提取到具有辨别力特征,针对该问题,本文提出一个应用于神经网络的损失函数,引入混淆率加权软标签作为类别间相似性度量的控制器,动态地给予样本相应的注意,特别是对于那些在训练过程中容易被错误分类的样本,迫使模型学习到有区别的特征,减少类别间的混淆,扩大类间的方差。在LabelMe和Caltech101两个小样本数据集上实验结果表明,所提出的损失函数泛化性更强且拥有更好分类性能。(3)提出一种新的并行快照集成方法。原始快照集成方法没有考虑到基分类器间的相关性,导致集成模型方差较高且训练数据规模较小时容易过拟合。针对该问题,本文提出并行快照集成方法,在多个快照集成方法中,通过相对平均KL散度选择准确度最高且差异性最大的基模型,并对其进行重组,为重组快照集成提供一种新的选择。该方法在UIUC-sports、LabelMe、15Scenes和Caltech101这4个小样本数据集上的实验结果表明该集成方法能够有效缓解过拟合。
其他文献
随着我国经济发展进入“新常态”模式,我国经济正从高速度发展逐渐转型为高质量发展。因而衡量经济发展效率的全要素生产率越来越成为人们关注的焦点。从微观角度来看,提升总
随着纳米科学与技术研究的深入和现代微纳米加工技术的发展,贵金属杂化纳米半导体复合材料逐渐发展成为研究的热点。通过这种杂化结构的人工调控实现材料的特殊性能,从而突出
动作识别是计算视觉领域的主要研究内容之一,复杂动作的准确理解对于服务机器人、增强现实和视频监控领域具有重要作用。现有技术在徒手动作识别方面已经取得了长足的进步,但
随着卫星传感技术的迅速发展,获取到的遥感图像的分辨率越来越高。如何在高分辨率遥感图像中提取有价值的信息是一项巨大的挑战,其中对遥感场景进行准确分类成为了目前高分辨
自1887年米尔斯夫妇在登州建立登州启喑学馆至1948年烟台启喑学校由人民政府接管更名为烟台聋哑小学,这所具有宗教性质的中国第一所聋哑学校在中国最动荡的年代成为近代中国
传统图像拼接算法已经难以满足日益复杂的图像场景的拼接需求,尤其是处理具有视差场景的图像拼接情况,拼接结果往往出现明显的模糊或拼接伪影,并伴随投影失真或结构扭曲等问
集群模式的研究是自组织系统研究中重要的组成部分,也是多智能体系统的一个研究热点,相关研究结果具有重要的理论意义和军事应用价值.目前对多智能体系统的集群性的研究多集
本文在高分辨率层序地层学理论的指导下并充分结合沉积学原理知识,对大庆油田杏六区东部葡萄花油层进行了系统的高分辨率层序地层学不同级次基准面旋回的精准识别同时进行高
在我国企业融资选择渠道上,债务融资占据着重要的地位。然而过高的债务资本成本会对企业债务融资产生不利的影响,融资资金的缺乏将阻碍企业正常的生产经营活动与投资活动需求
随着无线通信和移动计算技术以及全球定位和导航系统的快速发展,时空轨迹数据不断增加,因此对能够分析轨迹潜在模式的技术需求也在增加。同时,现实世界的许多时空现象呈现出