基于全卷积网络的羊场图像语义分割方法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:ososxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着奶山羊规模化养殖的推进,对羊场的精准监控及高效管理已成为亟待解决的问题。通过对羊场图像的语义分割,观察羊场环境和奶山羊的姿势与位置,可以实时监控奶山羊的行为状态,及时发现奶山羊的健康问题。本文以西北农林科技大学畜牧教学试验基地的奶山羊场图像为研究对象,构建羊场图像语义分割数据集,改进DeepLabV3+的解码网络,并优化ASPP结构,结合通道注意力机制,利用提取的图像特征,实现了羊场图像的语义分割。本文的主要研究内容和结论有:(1)羊场图像语义分割数据集的构建。针对现有羊场图像语义分割数据集不足的情况,通过网络摄像机采集数据并进行筛选,获得原始图像数据集,利用Labelme软件进行标注获取语义分割标签图。最后通过翻转变换、旋转变换和放缩变换的方式实现数据增强,同时划分训练集和测试集,为后续的研究奠定了数据基础。(2)基于改进DeepLabV3+的羊场图像语义分割。针对语义分割模型分割结果边缘不精细的问题,提出一种改进DeepLabV3+的羊场图像语义分割方法DP-DeepLabV3+。在解码网络中增加特征融合次数,充分利用编码网络的特征信息,并在羊场图像语义分割数据集上与多种经典的语义分割模型进行了对比。实验结果表明,DP-DeepLabV3+网络的PA达到93.75%,MIo U达到75.19%,具有较高的边界分割精度。(3)基于通道注意力的羊场图像语义分割。针对DP-DeepLabV3+模型存在对小尺度目标分割模糊和漏分的情况,提出一种基于通道注意力的羊场图像语义分割模型SE-DeepLabV3+。在DP-DeepLabV3+的基础上,优化ASPP模块提高特征信息的利用率和加入通道注意力模块突出关键特征,使模型分割精度得到提升。为进一步提升模型的性能,利用提取的图像特征作为网络输入来优化模型,发现原始图像结合边缘特征作为网络输入的方式表现最佳,能有效改善对小尺度目标的分割效果。实验结果表明,SE-DeepLabV3+在羊场图像数据集上PA值达到96.34%,MIo U值达到78.23%,具有较好的分割性能。综上所述,本文基于DeepLabV3+网络实现了羊场图像的语义分割,这对促进奶山羊的规模化养殖,提升奶山羊养殖的智能化管理水平有重要的推动作用。
其他文献
非均匀沙推移质是河道中泥沙输移的重要组成部分,直接影响河流中的水流结构、泥沙输移、河床演变等基础问题,正确认识非均匀沙推移质的运动规律是合理开发和保护河流的前提,对于促进河流动力学的发展以及满足实际工程需求都具有十分重要的意义。本文应用高速摄影技术与数字图像处理技术相结合的方法研究了非均匀沙的运动特性。主要内容有以下几点:(1)提出了利用数字图像处理与运动目标检测技术相结合的获取泥沙颗粒运动参数的
近年来,随着计算机性能的不断提升,计算机视觉领域得到迅速发展,基于计算机视觉的三维重建成为一个重要的研究方向,在社会生产生活等领域的应用也越来越广泛,其中基于图像的三维重建方法由于操作简单且恢复效果较好,成为近年来的热点问题。从单幅图像恢复目标区域的三维形状,由于其本身存在的不适定性,是三维重建中具有挑战性的工作之一。本文对基于单幅图像的三维重建方法进行了研究,主要研究工作如下:(1)提出了一种改
近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识
电子商务的蓬勃发展为用户提供便利的同时也带来了信息过载的问题。推荐系统能够为用户筛选出少量其真正感兴趣的物品,缓解信息过载的问题。为同时兼顾效果和性能两个方面,一般会将整个推荐系统分为召回和排序两个阶段。其中召回阶段使用简单模型,在线性时间内将系统中与用户相关的物品尽可能多的找回,形成召回候选集;而排序阶段则可以使用复杂模型,对召回候选集进行点击率预测和排序,提高最终推荐效果。综上所述,本研究构建
对动物的目标跟踪是研究其健康状况和行为分析的基础。为了准确实时地获取动物的个体信息和行动状况,本文以西北农林科技大学畜牧教学试验基地的奶山羊养殖场视频为研究对象,基于Target-Aware Deep Tracking(TADT)算法,并结合注意力机制和模板更新方法,对奶山羊对象进行跟踪及精度评价,验证了改进后算法的有效性。本文主要的研究内容与结论如下:(1)数据集的构建及预处理。为获取数量充足的
在计算机视觉领域,视频动作识别近年来倍受关注。视频通常具有丰富的场景类型,比如街道监控视频、室内监控视频和某种体育项目的比赛视频等,而针对特定场景下的视频动作识别会更具有实际意义。对于体育视频中的羽毛球单打视频,为了能更好地辅助教练分析视频中球员的动作,以及使用户可欣赏到每种击球动作的视频集锦等多元化需求,本文基于羽毛球视频精彩片段展开对羽毛球动作识别的研究。论文主要的研究内容和结论如下:(1)羽
精准养殖是目前畜牧业发展的主流方向。为提高奶山羊图像分割精度,促进养殖产业精准化和智能化发展,本文以羊场环境下获取的奶山羊图像为研究对象,实现了基于改进Mask R-CNN算法的奶山羊图像实例分割。本文的主要研究内容和结论有:(1)奶山羊实例分割数据集的构建。针对缺少奶山羊实例分割公开数据集的问题,通过在奶山羊养殖场安装远程高清摄像机,获取室内外奶山羊监控视频。首先对视频进行关键帧提取,人工筛选出
目标跟踪是计算机视觉领域的一个重要研究问题,在智能监控、自动驾驶、人机交互以及国防军事等领域都有着广阔的前景与需求。目标在运动过程中的形变、视点变化、遮挡和运动模糊等因素为目标跟踪领域带来许多挑战。基于多域卷积神经网络的目标跟踪方法(MDNet)因其适用于跟踪问题的多域网络结构及良好的性能表现受到了广泛的关注,但仍面临着模型训练速度慢及泛化性能弱的缺点。本文以MDNet及其改进跟踪模型为研究对象,
苹果因其丰富的营养价值,已成为世界上产量较高的水果之一。苹果产业的发展在满足人民生活需求的同时,也为当地经济带来巨大的效益。然而在苹果生长过程中,因受到自然环境因素的影响,在苹果叶片部位会产生多种病害。这些病害严重阻碍苹果正常生长,影响苹果的品质,从而造成巨大的经济损失。构建苹果叶片病害检测模型,对提高苹果品质,减少农户经济损失等方面具有十分重要的意义。本研究以苹果叶片常见的5种病害为研究对象,从
近年来人物图像的应用场景愈发丰富,但在获取过程中,拍摄者审美水平及拍摄环境的差异导致人物图像美感程度参差不齐,因此开展美学质量评价研究,从海量人物图像中挑选出有价值的高美感图像,具有极大的现实意义。人物图像美感评价具有较强的主观性和复杂性,目前还未有统一且完善的评价标准,因此本文以人类视觉特征和审美习惯为依据,提出一种评价人物图像美学价值的可计算方法,用以进一步提高美感评价的准确性,实现各角度的细