基于卷积神经网络的农作物叶部病害长尾识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:ccqccqccq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中大规模的图像数据集往往是呈现为长尾分布的,少部分的头部类别占有大量的样本,而大部分的尾部类别只有少量的样本。目前针对农作物叶部病害识别的研究大多数在类别均衡的平衡数据集基础上进行的,而现实生产中的农作物叶部病害样本分布却大多呈现为长尾分布的状态。卷积神经网络是图像识别领域的关键技术,而数据的长尾分布会使卷积神经网络性能大幅下降。本文针对长尾识别问题和农作物叶部病害识别的特点,主要进行了如下的分析研究工作。(1)本文针对重采样方案会损害模型特征表示能力的问题,在传统的双分支模型基础上进行改进,实现了一种具体更强特征表示能力的双分支融合长尾识别模型。模型设置两个分支网络,其中一个分支为平衡学习分支,使用重采样后的平衡数据作为平衡学习分支的输入。另一个分支为增强学习分支,使用Mixup算法增强后的数据作为增强学习分支的输入。在模型训练过程中两个分支卷积模块的参数是共享的,同时在模型的卷积模块中加入通道注意力机制以提升模型的特征表示能力。本文使用长尾识别领域的基准数据集CIFAR-10和CIFAR-100以及农作物叶部病害数据集Plant Village作为双分支融合模型的实验数据集,实验结果表明,本文提出的双分支融合模型在大部分数据集上都取得了较高的识别准确率,有效的提高了卷积神经网络在长尾数据集下的性能。(2)本文针对农作物叶部病害识别的难点和特点,在Res Net-18基模型的基础上进行改进,实现了一种基于残差网络的农作物叶部病害长尾识别模型。在数据预处理上本文采用了Cut Mix算法对病害数据集进行数据增强,Cut Mix算法在缓解长尾数据对模型性能影响的同时模拟了农作物叶片相互遮挡的场景,提高了模型对复杂背景的农作物叶部病害图像识别的鲁棒性。同时在模型中添加混合注意力机制模块,让模型在训练的过程中更注重对叶部病斑的学习,以提高模型对病害的识别精度。本文采用农作物叶部病害数据集Plant Village作为改进残差网络模型的实验数据,并采用常用的长尾数据构造方法在原始Plant Village数据集上构造农作物叶部病害长尾数据。实验结果表明,改进残差网络模型在农作物叶部病害长尾数据集上有较好的表现,有效提升了对农作物叶部病害长尾数据集尾部类别的识别准确率。
其他文献
随着大数据、人工智能等技术的迅速发展及普遍应用,数据的规模呈现快速增长的趋势,大量的数据需要被实时处理。Apache Flink作为新生代的流式数据处理框架,相比于Storm、Spark等框架拥有更高的吞吐量和更低的延迟,为流式数据的实时处理提供了新的选择。然而,Flink默认采用随机的方式将任务分配给节点,在当前流行将大数据服务部署到云平台的场景下,没有考虑到在集群中可能造成的成本浪费以及负载不
学位
传统密码学的安全性主要依赖数学困难问题,该问题在经典世界中难以被解决。随着量子计算机的出现,传统密码学的安全性岌岌可危,为了解决此问题,量子密码学应运而生。量子密码学依靠量子力学基本特性,使得它在理论上能达到无条件安全。鉴于此,学者们提出了许多量子密码领域的协议,量子密码学成为量子信息中的重要分支。量子隐私查询是量子密码学中的重要研究内容,也是经典隐私查询在量子领域的延伸。虽然学者们提出了许多基于
学位
同时具有高时间分辨率和高空间分辨率的遥感图像对于监测地表异质景观至关重要。然而,由于卫星传感器硬件技术以及发射预算等因素的限制,获取具有高时空分辨率的遥感图像并不容易。这使得国内外的研究学者将目光集中到对现有卫星观测数据进行后处理,从而获取所需的高时空分辨率数据。在深度神经网络中,相对于图像的一些基本属性:颜色、纹理、形状等特征,深层特征即通过设计网络模型来挖掘图像更为抽象、更高级的特征。在时空融
学位
车云计算是云计算技术在车载网上的扩展,旨在利用车辆闲置的计算、存储等资源构建成云为车辆提供实时服务,保证车辆决策的实时性和有效性,实现智能交通管理,提升交通效率及安全性。然而车云具有高度的动态性和自组织性,如何安全匿名且高效地构建车云以及保证云用户的隐私是一个挑战。目前已有的研究方案中存在车辆的隐私保护问题或是构建车云的方案效率不高。本文重点研究在保护车辆身份隐私及位置隐私的情况下高效地构建车云,
学位
随着数据量的爆炸式增长,数据中蕴含的知识信息也越来越复杂多元化。因此,如何从海量数据信息中有效地挖掘出知识成为了当今学者研究的一大热点问题。知识发现一直都是大数据技术下的一个主要研究点之一,基于概率粗糙集的三支决策就是一种典型的知识发现算法,一个作为解决复杂问题和不确定性问题的三分而治模型,并且结合多粒度思想构建的序贯三支决策模型,能很好地实现复杂问题的动态决策的效果。然而,在实际决策中,当没有决
学位
随着云原生时代的到来,Kubernetes和容器技术已经成为云计算领域的主流技术。Kubernetes因其实现了对容器的服务发现与调度、负载均衡、服务自愈、弹性扩缩容和存储卷等功能,被作为容器管理平台的首选。虽然Kubernetes具备丰富的容器管理功能,但是它并不会考虑容器运行过程中的成本问题以及整体Pod之间的关系,也不具备重调度机制来节省成本。为此,本论文提出了基于Kubernetes的成本
学位
古文物承载着人类文明千年以来的历史文化和精神内涵,对研究古代经济、文明等方面起到至关重要的作用。通过将古文物进行数字化处理,从二维图像转换为三维模型的形式能够有效地减少实体展览所带来的空间和时间上的资源损耗,同时能够使人们能够通过网络的形式以三维的角度更全面地去了解并学习古代文物所蕴含的历史文化。不同于传统的三维重建方式,基于深度学习的三维重建方式更适用于单视图的情况,同时能够在不需要复杂的图像处
学位
随着计算机和三维扫描设备越来越快速的发展,三维几何模型也逐渐成为表达数字媒体信息的方式。点云作为三维模型主要表达方式,其应用场景也越来越多,但是原始点云占用空间较大,而且含有噪声,不适合直接进行使用。骨架可以理解为三维模型精简之后的表示,只需要原始三维模型的部分信息,就可以表达三维模型全局信息。因此,从三维点云数据中分离出可靠的骨架是非常重要的。目前基于深度学习的骨架提取方法主要针对二维图像,针对
学位
随着互联网的飞速发展,网络用户越来越多,社交媒体已经在人们的生活中占据了重要的地位,网络舆情的监管也变得越来越重要。如何分析群众的情感变化,如何挖掘民众关心的热点话题,已成为研究人员的重要研究课题。然而传统的舆情分析方法无法直观地表达文字背后的潜在信息,这就需要数据分析和可视化技术的结合。针对以上问题,本文提出了一种面向新冠肺炎舆情的可视分析方法,可以有效地帮助用户进行微博舆情分析。本文主要做了如
学位
视频逐渐成为当今主流的传播媒体,而海量的视频数据会给视频内容的审核带来巨大的挑战,因此使用计算机去识别视频中的行为具有重要的意义。此外,计算机可以处理多模态数据,完成人体行为识别任务,其中处理骨骼数据的方法具有计算量小、对光照变化鲁棒性强,动作表达能力强等特点。目前,使用基于图卷积网络的人体行为识别已成为一种新兴趋势。然而,如何准确的判断所属行为类别仍是人体行为识别技术的一个难点。本文在对人体行为
学位