基于主动学习少标签样本的卷积神经网络研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:danxiaoni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展与工程需要的多元化,计算技术在图像识别领域中的应用越来越广泛。其中卷积神经网络具有优秀的图像识别效果,相比于常规图像识别算法,它具有更为有效的特征提取结构以及识别结构,已成为图像识别领域中主要技术之一。众所周知,图像样本的质量、数量是影响图像识别的关键因素,但是在一些重要专业领域,如遥感、雷达、医疗等,不仅面临获取大量、高质量的图像数据存在困难,更面临对这些专业图像标注的专业人力不足的困难,导致这些专业领域可使用的已标注图像数据不足,即这些领域可能存在能够使用的已标注图像样本较少的问题。由此可见,研究少样本、高识别率的算法,是紧迫的工程需求。本论文提出一种分组式主动学习(Grouped Active Learning,GAL)策略以减少训练所需标注样本的数量,并对其可行性进行验证。论文主要工作包括:(1)对GAL中的分组方法进行研究,通过仿真实验得到了分组筛选样本与整体筛选样本将带来的损耗,验证了GAL的可行性,并将其应用于主动学习策略的各个阶段,完成基于GAL整体框架的设计;(2)研究不同的主动学习筛选算法的影响,发现不同的筛选算法在训练卷积网络的不同阶段有不同的效果;(3)基于GoogleNet卷积网络结构完成对MSTAR SAR数据以及遥感图像的识别网络结构设计。以上三项工作,从卷积神经网络本身的特征提取能力、主动学习筛选算法及最终识别网络结果展示并说明了GAL可以应用在不同种类的图像识别中,并能有效减少图像识别所需标签。论文的具体工作内容如下:(1)GAL中数据分组的可行性研究。对样本进行分组与全局样本的主动学习差异进行研究。同时,利用仿真实验验证,在一定假设条件下分组对主动学习所筛选出来的样本带来的影响可以近似忽略,证明了分组式主动学习的可行性;(2)GAL中的筛选策略的研究。重点研究了单一主动学习筛选策略对识别效果的影响。实验数据表明:不同阶段采取不同的筛选算法能够在以5%总样本单位为一个阶段的情况下提升3~6%的识别效果,获得一个性能优良的识别网络;(3)GAL-GoogleNet卷积神经网络整体实现与应用研究。重点利用了GoogleNet不同层对数据处理效果,并在训练过程采用微调(fine-tune)策略加强卷积网络识别效果。为了验证本文所提出的方法有效性,将GAL-GoogleNet网络应用在三类不同的数据集上进行实验,结果如下:(1)应用于Uc Merced_Land Use数据集上,在降低训练集50%规模情况下进行训练得到整体样本正确率99.57%的识别结果。(2)应用于AID数据集上,在降低训练集20%规模的情况下进行训练获得整体正确率98.02%。(3)应用于MSTAR SAR雷达图像数据集,在仅使用训练集40%的情况下,获得了与近几年文献相似、更优的识别结果。本论文的研究工作对主动学习技术的工程应用有一定参考价值。
其他文献
随着互联网技术的发展与普及,IPTV作为集通讯、互联网、多媒体等多技术于一体的崭新技术横空出世,为提升我国智能化终端电视产业的发展做出了卓越的贡献。然而IPTV业务承载网络以IP网络作为基础承载网,直接与Internet等网络互联,所以面临着IP网络所具有的各种网络安全风险。但是IPTV网络的渗透测试与安全评估缺乏相应的技术理论支持,当前攻击图模型存在量化指标较单一、客观性差、生成效率较慢,针对目
目前深度学习算法已广泛应用于合成孔径雷达(SAR,Synthetic Aperture Radar)图像的目标检测。然而,当前主流基于深度学习的检测方法存在模型复杂度高、检测速度慢以及对特殊尺寸目标检测性能低等问题。针对上述问题,本文将着重研究基于改进Faster R-CNN(Faster Region-based Convolutional Neural Network)的SAR图像舰船目标检测
在5G中,超高可靠和低延迟通信(Ultra-Reliable and Low-Latency Communication,URLLC)可以有效降低实时无线控制系统中的时延以及丢包率,以满足工业互联及自动化中实时、可靠等高性能要求。然而,为了满足严格的服务质量(Quality of Service,QoS),URLLC消耗了大量的无线资源,严重阻碍了该技术的实施和大范围部署。因此,针对多控制回路的实
伴随着云计算的不断发展,越来越多的企业将数据和服务转移到云端。在传统模式下,企业运营维护数据中心存在设备管理困难、资源利用率低、且硬件升级成本高的问题。而云计算平台能将计算资源、网络资源、存储资源等资源弹性地按需提供给企业用户,极大地为用户节省了硬件管理维护成本。当前的云平台重点在于如何按需切分调度资源,给用户提供高效稳定的服务。但在消息推送方面,缺乏专门的功能组件进行处理,平台控制中心与各业务模
近年来,在图像识别、语音识别等领域,深度学习的表现越来越突出,成为业界内很多人的研究对象。而在一个的神经网络中,包含了大量的参数,在进行网络训练时,参数量越大,单次训练需要的时间越来越长。其次,现有的深度网络框架并不能满足任何环境下的网络运行。而近年来,图形处理器GPU(Graphic Processor Units)硬件设备得到了快速升级,通用计算技术因此而有了飞跃性的成长,到如今已慢慢开始走向
后疫情时代,“新基建”、“智慧城市”俨然已成为“十四五”期间最热的关键词之一。兼具分布范围广和承载能力强等优势的智慧合杆,其上搭载与城市运行息息相关的诸多Io T设备,是天然的信息采集、展示入口。围绕智慧合杆上搭载的大量Io T设备进行管理,进而打造串联万物的物联网平台成为近年来的研究热点。本文面向河南省鹤壁市5G智慧合杆一期横向合作项目,基于实验室已有云计算相关产品,提出云边端协同系统性方案,解
当前随着人们对快捷获取知识的渴求和自然语言处理的快速发展,实体关系抽取技术作为该领域经久不衰的重要研究方向,对于领域知识图谱的构建和各种自然语言处理应用,它都具有重要贡献。虽然关系抽取技术已经发展出了各种层出不穷的理论,但是自动化抽取的精准性不能达到较好的实用性。而基于深度学习的方法,比如传统管道方法存在错误传播和信息冗余,联合抽取方法存在实体重叠、关系类别标签不平衡问题,最终会导致关系抽取模型总
人体步态,作为一个新兴的生物识别特征,可以利用图像传感器以及惯性传感器采集在一段时间内行走过程中的步态信息(如一系列视频帧或加速度、角速度等),进行身份识别。与目前日常生活中被广泛应用的生物特征相比,生物步态特征具有能够远程捕获以及不易模仿等优点,可以通过非接触式的方法获取到被测者的步态信息,进而完成身份信息的判别。本文首先制作数据集,利用自主编写的Android平台APP依次采集被测者完成指定动
近年来,深度卷积神经网络(CNNs)在计算机视觉领域表现出色,同时计算机视觉等人工智能系统工程应用的需求也日益增长,对于神经网络压缩与加速的方法研究也日趋活跃。但是由于其过参数化的设计,卷积神经网络导致了网络模型巨大的参数量和昂贵的计算消耗,使得将模型部署到一些资源受限的设备的上变得非常困难,如嵌入式设备、移动手机等。如何在资源受限的设备上部署高可用、高可靠的网络模型,这成为了人工智能在现实生活中
随着信息与科学技术的繁荣发展,未来现代电子信息作战具有装备信息化程度高、交战过程实时变化性强、战场信息不确定性强、博弈强对抗等特征。指挥员针对敌方战场信息的认知提出了更高的要求,但传统的方法过于依赖专家提取特征,人为提出特征间的关系会带来主观性过强、经验依赖性过高以及实时性较差等问题。贝叶斯网络作为基于图论与概率统计的图模型,以数据学习为核心,避免了人为主观性过强等问题从而在许多领域发挥重要的作用