基于全卷积神经网络的大田复杂场景图像的语义分割研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的不断发展,深度卷积神经网络也越来越多地被应用于计算机视觉领域,使其在智能农机大田作业中拥有广阔的应用前景。为了更好地获取大田环境信息,本文以西北农林科技大学试验田图像作为研究对象,利用深度学习技术,结合有监督训练方法,实现了大田复杂场景图像的语义分割。本文的主要研究内容及结论如下:(1)全卷积神经网络模型的设计。针对大田场景易受光照、天气和温度等因素的影响,且场景中目标种类较多,传统的分割算法不能有效解决以上问题,而卷积神经网络对几何变换和光照具有高度不变性,设计了全卷积神经网络(FCN)模型进行大田复杂场景图像语义分割。通过反卷积层的方式,实现了大田图像像素级的语义分割。(2)基于FCN的大田复杂场景图像的语义分割。针对FCN中容易出现的过拟合问题,研究了数据增强的方法。然后采用模型二阶段训练的方法,解决了深度学习网络训练时间长,不容易收敛的问题。最后采用FCN-32s、FCN-16s和FCN-8s三种不同的上采样网络结构进行了对比实验,实验结果表明,FCN-8s网络结构效果最好,其像素准确率可以达到90.87%,平均IU可以达到75.52%。针对大田场景光照充足和光照不足的情况,分别采用光照充足和光照不足的数据集对模型进行测试,实验结果表明该模型对于大田光照变化具有良好的适应性和稳定性。(3)大田复杂场景图像语义分割模型的优化。针对传统激活函数对于数据利用不充分,对噪声鲁棒性差的问题,本文分别研究了采用修正线性单元(ReLU)和指数线性单元(ELU)激活函数的模型,实验结果表明,ELU激活函数可以加快模型的收敛速度,且对噪声的鲁棒性较好。然后采用Batch Nomalization(BN),使得FCN训练过程更加稳定,同时起到了正则化的作用。通过分别采用支持向量机(SVM)和多项逻辑回归(Softmax)分类器建立模型,实现大田复杂场景图像的语义分割,通过对比实验发现,采用SVM分类器的模型效果表现更好。优化模型的像素准确率达到了91.86%,平均IU提升到了76.84%,说明经过优化的模型更适合大田复杂场景图像的语义分割。综上,本文采用ELU激活函数、模型二阶段训练和SVM分类器基本实现了基于FCN的大田复杂场景图像的语义分割模型,并实验验证了该模型的有效性,可以直接利用大田图像,实现了大田图像像素级的预测,其为大田复杂场景图像语义分割的研究提供了一定的基础。
其他文献
2011年名校自主招生考试早已落下帷幕,由于名校联考格局的出现,各名校自主招生试题可谓异彩纷呈.下面对2011年清华等五校联考自主招生试题第6题解法与题源进行详细的探究,与
期刊
<正>张仲景在《伤寒论》一书中,不仅对中医理、法、方、药作了精辟的论述,同时还重视针灸对疾病的治疗作用。其针灸治疗特色,以《内经》理论为基础,辩证施治为准绳,三阴三阳
会议
背景乳腺癌是女性最常见的恶性肿瘤之一,其发病率逐渐上升。由于ERa表达类型的不同,乳腺癌可分为两大类,其一为ERa阳性表达的乳腺癌,其二为ERa阴性表达的乳腺癌。临床上对于
为了提高三相PMSM调速系统的动态品质,利用滑模控制对扰动和参数不敏感,相应速度快等优点,设计了一种基于滑模控制的速度控制器。利用MATLAB/Simulink仿真软件,搭建控制系统
经颅多普勒超声(TCD)被广泛应用于临床脑卒中诊断中,应用人工智能技术对TCD数据进行分类,从而实现脑卒中辅助诊断,可以节约宝贵的医疗资源,具有重大的现实意义。本文重点研究了
本文依据常用的水轮机调节系统数学模型,对400多组不同参数值下的调节过程进行计算机仿真。将仿真所得的系统性能指标和调节参数分成三组进行回归分析,得出在水流加速时间常
目的探讨不同程度前牙缺损玻璃纤维桩核修复的临床疗效。方法临床选择167例前牙缺损患者的共231颗患牙,按牙体缺损程度分3类:Ⅰ类、Ⅱ类和Ⅲ类,按修复材料分为A组,采用玻璃纤
背景:前列腺癌是男性常见的恶性肿瘤之一,高居男性癌症死亡率前列。我国前列腺癌的发病率虽低于欧美国家,但随着我国老龄化人口比例逐渐增高,前列腺癌发病率亦有逐年上升的趋
[目的]探究2种盐剂的草甘膦对北方旱地果园土壤微生物的影响。[方法]以草甘膦异丙铵盐和草甘膦钾盐为试材,通过田间定位试验,考察旱地果园土壤微生物对不同盐剂草甘膦的响应
随着旅游信息化的发展,智慧旅游应运而生。通过选取开封市智慧旅游项目作为研究对象,分析本地旅游从业者对其的感知。经数据分析得知:旅游从业者对智慧旅游具体建设项目的满意