基于胶囊网络的复杂小样本图像分类研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:weiyuan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小样本图像分类是计算机视觉领域的一项重要任务,现实生活多数应用场景都存在样本数据量较少的问题,使该领域受到国内外学者广泛关注。本文基于胶囊网络模型,针对不带噪声相对复杂的小样本数据集提出融合胶囊网络与Darknet的分类模型,针对带噪声的复杂小样本数据集的分类提出融合胶囊网络与深度残差收缩网络的模型,并通过实验验证了所提融合模型的有效性。本文具体工作如下:(1)针对相对复杂的小样本数据集的分类问题,提出一种将双线性Darknet融入到胶囊网络的分类模型。首先将Darknet改进为双线性结构,深层特征提取器采用3*3的卷积核,提取图像的深层细节特征,浅层特征提取器采用5*5的卷积核,捕捉图像长距离的边缘特征,通过深层特征提取器与浅层特征提取器同时提取图像的深层与浅层特征进行融合,以增加图像的关键特征;其次通过胶囊单元将特征表征为向量,增加关键特征的空间信息,且通过低层胶囊定向激活高层胶囊进行特征传递,避免特征传递过程中造成有效信息丢失;最后在胶囊网络的损失函数中加入网络各层权重的L2正则化项,使网络权重值更加平滑,防止某一特征权重过大产生过拟合的问题。实验表明,在不带噪声相对复杂的小样本数据集的分类任务中,融合模型的分类准确率明显高于Res Net、Xception等卷积神经网络与胶囊网络,模型分类准确率获得明显地提升。(2)针对带噪声的复杂小样本数据集的分类问题,提出一种将深度残差收缩网络进行改进融入到胶囊网络的分类模型。首先将深度残差收缩网络改进为双线性结构,同时取消浅层特征提取器的残差连接,避免在浅层特征中引入图像噪声,且通过残差收缩模块对深层与浅层特征各通道的噪声进行了有效的剔除,减少了特征的冗余信息;接着将深层特征与浅层特征进行融合,增加了图像的关键特征;再通过胶囊单元增加关键特征的空间信息,同时避免特征传递过程中的信息丢失;最后采用Focal Loss作为模型的损失函数,以解决部分类别难以区分的问题,有效提升模型的分类准确率。实验结果表明,在带噪声的小样本生活垃圾图像分类任务中,融合后的模型分类准确率获得了一定程度地提升。
其他文献
随着人们生活水平的不断提升,对环保质量的要求也在不断提升。而集中供暖以其良好的供热质量、超高的供热效率以及较小的环境污染而受到许多人的热爱。随着我国城市不断发展,城市化进程不断加快,城市大部分家庭中都实现了集中供热。根据对城市集中供热系统进行分析,其主要是利用输送管道等作用将热源所产生的热能输送到用户家庭内,为用户提供热能。但是在实际的供热过程中热网会受到多种因素的作用从而产生水力失调、热损等问题
布里渊动态光栅(BDG)是基于光纤中的受激布里渊散射效应产生,具有全光生成、读写分离、可快速重构、多参数可调等优点,目前已在温度和应变的无交叉敏感测量、高空间分辨率传感、周围介质浓度感知、光延迟线、光信号存储以及全光触发器等领域得到应用。然而,传统的BDG存在难以稳定维持、易产生多光栅等问题。为了解决上述问题,本论文利用混沌激光具有图钉状的自相关特性,首次在保偏光纤中实验产生了混沌BDG,进一步研
粒子物理是研究基本粒子的性质及其相互作用的基础学科,是当今科学技术发展的最前沿。近年来国际上对气体径迹探测提出了更高的物理需求,时间投影室(TPC)作为核心径迹探测器的重要选项,要求其探测精度达到百微米量级。面向高位置精度(~100μm)的探测需求,不但要发展相应的探测技术,还需要考虑针对大尺寸探测系统的标定研究,紫外激光模拟特定径迹是一种新型、有效的测试方法,国际上ALICE、STAR时间投影室
快速傅里叶变换(Fast Fourier Transform,FFT)算法是离散傅里叶变换(Discrete Fourier Transform,DFT)或其逆变换的快速算法,是处理器基础软件生态的重要组成部分,在工程、科学、物理和数学等领域的应用十分广泛。实数FFT算法作为输入或输出为实数序列的离散傅里叶变换,在智能计算、图像处理、数学等领域具有广泛的应用。随着应用场景的日益复杂化,这些应用领域
随着时代的发展人们对服务质量的要求不断提升,银行是人们生活中必不可少的一部分,很多人发现在银行办理业务所需要等待的时间非常长。如果银行不能够解决该问题,将会直接影响其市场竞争情况。目前,大部分银行已经引进了先进的排队叫号系统,基本上实现了排队的智能化处理。但是,由于现有排队叫号系统自身设计理念存在的问题,导致银行窗口的综合利用率较低,存在部分窗口闲置,部分窗口等待时间较长的问题。为此,本文研究一种
随着信息技术的快速发展,以通信网络为基础的现代通信技术已深入到人们生产生活中,保证信息的高速、安全传输已成为各国通信领域的重要研究目标。混沌光场因其类噪声的随机性及对初值条件敏感等非线性动力学特性,已经被广泛应用在保密通信、物理随机数产生等研究领域中。外腔反馈的半导体激光器作为典型的混沌动力学系统,可产生高维的混沌信号,为研究非线性效应和复杂的光子动力学提供了良好的平台。然而,外腔反馈会引入周期性
2021年12月21日,省委书记、省新冠肺炎疫情防控工作领导小组第一组长袁家军深入绍兴市上虞区防疫集中隔离点、封控村社等场所,进一步检查调研疫情防控工作,看望慰问一线干部群众,并在上虞区疫情防控指挥部主持召开座谈会,听取有关情况汇报,研究部署下一步重点工作。
期刊
图像分割简单来说就是将一副图像分割成互斥的有意义的区域,它是计算机视觉的基本问题.在过去的几十年里,已经有大量的关于图像分割的文献发表,广泛应用在医学图像处理、目标跟踪、识别、图像重建等领域.在以往的图像分割技术中,许多成功的方法都得益于将图像元素映射到图上.然后利用图论的相关理论知识在离散空间中求解分割问题.本文主要研究基于图论的图像分割的一些特性及其应用,主要工作如下:(1)针对传统的分水岭算
山西省汾阳市田村后土圣母庙壁画是明代道教壁画的代表作,展现了神话中的后土圣母传说和祭祀卤簿的内容,反映了山西后土信仰。本文对汾阳田村圣母庙壁画的艺术和内容进行了梳理。圣母庙壁画采用工笔重彩、沥粉贴金的绘画技艺,绘制了侍女、太监、文武官员、殿堂、亭廊、山石花木、车马器具等众多的人物、事物形象,其中的人物造型具有动态多样性的特点,服饰器具则反映出贵族奢侈生活的样貌,具有极高的艺术价值。通过文献研究法、
心力衰竭,简称心衰,是各种心脏疾病发展的终末阶段。心衰患者预后死亡率是高度可变的,死亡率从5%到75%不等。因此评估心衰患者预后死亡率,根据预测死亡率情况来使医生制定更加科学的治疗方案,是防止病情进一步恶化,从而降低医疗开支的一种重要手段。目前,针对心衰预后死亡率研究模型主要分为两种,一种是根据医学知识和统计学出发的医学领域模型,另一种是依靠计算机算法的机器学习和深度学习模型。但这些模型都存在着患