基于深度学习的图像语义分割技术研究与实现

来源 :河北科技大学 | 被引量 : 1次 | 上传用户:luote51499
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全卷积神经网络是在卷积神经网络的基础上将最后的全连接层换成同维度的1*1的卷积层,再辅以反卷积和上采样层构成的。通过全卷积神经网络可以完成图像的语义分割。图像的语义分割是指从视觉层出发通过一定的手段将图像的对象层提取出来,通过对视觉层和对象层的综合,得到图像的概念层信息。即图像的语义信息。课题系统研究了卷积神经网络的基本理论,对图像语义分割的概念进行了介绍,进而引出了全卷积神经网络,之后以全卷积神经网络FCN为研究对象,对全卷积神经网络从结构到训练进行了系统探究。全卷积神经网络的训练需要借助深度学习技术,而深度学习实践中深度学习框架是至关重要的,课题选择谷歌开源的深度学习框架caffe作为平台,VOC2012为数据集,对FCN进行了训练,训练得到的模型MIOU值达到了59.65%。为了使训练对特定的场景更有针对性,在voc2012数据集的基础上加入了自制数据集,对FCN进行了二次训练,经过训练,针对特定场景的MIOU值达到了62%。此外,还对FCN的衍生版U-net和SegNet进行了介绍,详细介绍了U-net和SegNet的结构。U-net主要针对小样本量的深度学习任务,SegNet在自动驾驶和智能机器人领域应用最为广泛。最后,重点分析了FCN的训练过程。对训练过程的各个阶段进行了可视化分析,通过对卷积核、训练的中间结果进行可视化,形象地展示了利用FCN进行图像语义分割的详细过程,使课题的研究更加透彻。主要工作如下:1)在结构方面采用了FCN全卷积神经网络,该全卷积神经网络结构卷积部分采用VGG,上采样部分采用多级采样,最大限度地提升分类精确率。2)数据集方面,针对特定的应用场景,采用公共数据集和自制数据集相结合的手段,按照公共数据集的格式处理自己采集的原始图片,最后将处理好的原始图片加入到公共数据集中,从而使得公共数据集对某个场景的适用性更强。
其他文献
目的:探讨孤独症儿童社会交往能力发展与执行功能和心理推理能力的关系。方法:采用横断面研究方法,选取符合美国精神障碍诊断与统计手册第4版(DSM-Ⅳ)诊断标准,同时经学龄儿
随着电力电子技术在新能源、高速机车、直流输电等大容量电力变换领域的广泛应用,其可靠性问题成为学术界和工业界的研究热点。基于因果模型的可靠性分析方法虽然在研究早期
农耕文化是我国人民几千年来智慧的结晶,它不仅是中华民族世代繁衍、生生不息的物质基础,还影响着世世代代人的价值观念和伦理道德。传承中华民族传统农耕文化,有利于实现和
蒽醌染料废水是染料行业较难处理降解的废水之一。本文采用芬顿氧化+MBR耦合技术对蒽醌活性染料X-BR进行了降解研究。研究发现,通过芬顿试剂的预处理后,X-BR废水的可生化性得
科技新闻记者与其他方面的新闻记者不同,这一工作的要求更加特殊。科技新闻记者需要具备更加专业的知识和素养,才能更好地发挥自身的职能,但是现在的科技新闻记者比较稀缺,需
针对目前医院智能化管理中,大多关注手术室及急救设备的优化调度,缺乏对中医康复资源调度方法的研究。本文给出一类智慧中医康复医学系统的框架,构建了由中医康复医师、治疗
[目的]:慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD),其作为全球第3大死亡原因之一,严重威胁着人类的健康。多项研究表明,噻托溴铵及孟鲁司特在治疗COPD
海上丝绸之路拥有两千多年历史,在中国对外贸易、文化交流、技术传播等方面做出了卓著贡献,留下了一批宝贵的文化遗产,是人类文明发展史上的一条瑰丽玉带。海上丝绸之路文化遗产的公共属性决定了政府对其应尽保护之责。然而,在城市发展进程中,沿线城市的海上丝绸之路文化遗产在保护与开发上矛盾凸显,一些古文物、古港口、民间工艺和民俗文化等物质和非物质文化遗产均遭受了不同程度的损坏和遗失。因此,如何从整体上理清政府在
在中国经济高速发展的阶段,投资过热可能带来通货膨胀等不利影响,固定资产投资与生产总值的关系受到人们的广泛重视。文章利用1982~2013年的数据,通过实证研究发现湖北省地区