基于Transformer的农业图像分类方法研究

来源 :长春工业大学 | 被引量 : 1次 | 上传用户:kathrynde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术得到快速发展,计算机视觉与农业领域结合引起学者们的广泛关注。神经网络在复杂场景下对农业图像的识别成为一个热门研究课题。如今在农业的发展中,杂草和害虫对农作物的产量和质量影响依旧巨大,致使农业发展缓慢。因此,快速且准确识别杂草叶片数目和害虫更有利于解决上述问题,对农业领域其他相关研究有着良好的应用价值。本文分析了深度学习技术及其在农业领域应用的研究现状,结合不同的农业领域图像,以神经网络理论为基础,主要的工作内容如下:(1)缓解数据集分布不均衡和数量较少的问题。本文使用的Leaf-Counting数据集具有类别不均衡问题,为了使数据集分布更均衡合理,采用过采样的方法对数量少的类别进行样本扩充,同时创建Leaf-Counting-B数据集进行额外的补充。并为复杂场景下害虫分类创建Pests-D数据集。对本文实验使用的数据集进行数据处理,包括图像裁剪和图像归一化,并选用了旋转、翻折、添加噪声等数据增强方式进行进一步的样本扩充,有效避免数据量过少带来的过拟合问题。(2)提出一种改进的Vision Transformer杂草叶片数目分类模型。由于对图像直接硬性分块容易造成图像信息丢失,使得模型对整体图像信息不敏感,从而导致模型准确率较低等问题。针对以上问题,本文结合卷积神经网络模型的层次化结构,提出了CNN-Stem模块,并基于Vision Transformer模型构建一种新的网络模型,命名为C_Vi T。通过消融实验验证模型改进的有效性,并通过参数搜索实验为模型寻找合适的网络超参数。经实验验证,改进的网络模型在Leaf-Counting数据集的准确率提升到74.05%,比Vision Transformer模型提升1.20%,相较于Inception-V3模型提升3.98%。(3)提出基于集成学习的害虫分类模型。由于单一模型在害虫分类过程中存在因特征提取不充分或特征丢失造成害虫误检等问题。针对以上问题,为弥补单一模型学习能力的不足,通过排列组合的方式对Goog Le Net、Res Net、Vi T、Pi T这四个网络模型中的两个或两个以上进行集成学习,并用于害虫分类任务。将各模型保留特征提取部分,接入新的分类结构模块,使用迁移学习方法对网络模型进行再训练,最终使用集成学习方法对不同模型进行集成。经实验验证,通过集成学习后的模型分类准确率普遍要高于各单一模型,并且模型鲁棒性更强。
其他文献
近年来,随着中国经济社会的不断发展和互联网金融的快速崛起,传统金融机构网络借贷业务逐步兴起,通过互联网进行贷款的交易逐年增多。网络借贷在给金融机构带来巨大利润的同时,也对其互联网金融风险控制能力提出了巨大的挑战。准确的评估互联网借贷客户的还款行为是互联网金融风险控制的重要环节。综上所述,本研究通过改进深度残差网络,来对客户的两种还款行为(违约还款和提前还款)进行预测,进而降低金融机构网络借贷业务的
学位
近年来,随着社会科学技术的进步,现代工业过程不断向大型化、复杂化发展,故障发生的原因和频率也不断增加。发生故障时,无论是对人的生命还是公司的财产,造成的损失都是无可挽回的,因此及时准确的诊断故障和预知故障的发生是十分必要的。由于数据结构的复杂性,基于数据驱动的方法在故障诊断中作为重要基础而被广泛使用。无需依赖精确的模型,仅从生产设备收集的大量数据作为依据,处理过程数据集中存在的非线性、高斯性、时变
学位
随着网络技术与智能终端设备的快速发展,具有移动性的群智感知作为一个新的众包模式也随之得到广泛关注。相比于传统众包,群智感知对时空有一定要求,可以通过特定时空的人获取特定时空的感知数据,即工人需要特定时间移动到特定位置执行并完成感知任务。在群智感知中,任务分配问题已经成为群智感知主要研究内容,合理的任务分配可以保证感知系统的发展。当前研究成果存在以下局限性,出现人手不足问题,导致任务完成情况存在不理
学位
深度学习为各领域提供了巨大的发展空间,同时也带来了潜在的隐私威胁,用于人脸检测和训练深度学习模型的人脸图像面临着身份泄露的威胁,人脸图像的身份隐私保护成为重要的研究课题。目前人脸身份去识别算法生成的图像面部结构完整、人脸自然,但仍然存在表情、肤色等属性破坏,保护模型安全性不足的问题。对此,本文展开了以下研究工作:(1)提出了一种强面部特征分析算法。根据人脸识别技术的特点,利用欧氏距离(Euclid
学位
随着工业化的发展,不可再生能源如化石燃料逐渐消耗,并且环境污染愈发加重,人们对太阳能这种绿色、清洁、总量巨大的能源的利用愈发增多。光充电超级电容器是一种一体化器件,它将太阳能电池和超级电容器集成为一体。这样的器件可以提高光伏器件对太阳能的利用效果,及时将转化得到的电能储存到储能器件中。相比传统的用导线将光伏器件与储能器件连接的方式,光充电超级电容器可以减少器件内阻,缩小器件体积。本篇论文使用量子点
学位
近几十年来,随着能源短缺问题越来越严重和日益增加的可移动电子设备,关于自供电、可持续的绿色能源研究迫在眉睫。近年来,收集日常生活中浪费掉的随机机械能并转化为电能成为目前研究的主要方向。TENG是一种能够将周围环境中的各种机械能转化为电能的新型能量收集装置,因其在能量收集的高效性、低成本和自供电传感方面的优势,使其得到了迅猛的发展。TENG的接触分离模式由于具有设计简单、高瞬时输出功率、容易实现多层
学位
本项研究采用电沉积技术,以铜锡合金替代铜或镍作为中间层成功在铝基体表面制备锡镀层,并以电流密度为工艺条件,分析铜锡合金镀层与锡镀层在不同电流密度下的形貌及性能变化。利用扫描电子显微镜(SEM)、激光共聚焦、硬度仪、能谱仪、微纳米力学综合测试系统、X射线衍射仪(XRD)、电化学工作站以及盐雾试验箱对铜锡合金镀层及锡镀层的表面形貌与物相组成进行表征,并对镀层的硬度、耐磨性、耐腐蚀性进行性能测试。铜锡合
学位
肺结节的检测是肺计算机辅助检测(CAD)系统的关键组成部分。针对带医生标注的数据不足及肺结节检测过程中存在的误检、漏检的问题,使用深度学习的方法,构建了一个新的基于数据增强和注意力机制的肺结节检测模型。深度学习在肺CAD系统中的应用需要大量带标注的数据用于模型的训练,但由于人工标注成本昂贵、费时费力,且需要医生的专业背景知识,导致带准确标注的数据数量非常有限。一方面,针对上述问题,提出使用CT-G
学位
群体智能优化算法是一种模拟自然界生物和非生物群体行为的随机搜索算法,由于其适用于高度复杂的非线性问题,因而得到了广泛的应用,在解决复杂的单目标系统优化问题中的优势已经得到了充分的体现。然而,现实世界中的优化问题往往是多属性的,通常是针对多个目标同时进行的,在大多数情况下,同时进行优化的多个目标相互影响、相互冲突。为了实现总目标的最优化,往往需要以综合的方式考虑相互冲突的子目标,也就是说,在各个子目
学位
计算机断层扫描(Computed Tomography,CT)技术是用于早期诊断癌症的关键手段。肺部计算机辅助诊断(Computer Aided Detection,CAD)系统集成机器学习和医学图像处理等方法,旨在从CT上快速、准确地检测结节并识别肺结节的良恶性,从而提供高效的辅助诊疗方案。许多机器学习算法被应用于肺CAD系统中,主要分为两大类:其一为传统机器学习方法,其二为深度学习。传统机器学
学位