增强图像边界的语义分割算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:new4kakaxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉的处理和研究作为一个有价值和意义的课题受到研究者们的广泛关注。在计算机视觉问题中,图像的语义分割技术在自动驾驶汽车、军事武器、人机交互、智慧工地、虚拟现实、智慧生产等领域有着深远的影响,但是深度卷积神经网络的结构也会使得分割任务面对一些问题。一方面,深度神经网络在深层学习高级语义信息的过程中,部分边界轮廓信息和位置信息会丢失。另一方面,对于图像的语义分割的结果,由于特征包含的空间信息不足,这会导致了边界轮廓信息表现不显著,弱纹理,低分辨率等问题。本文就如何解决提高语义分割过程中边界轮廓的准确性相关问题展开研究,本文不仅仅取得了良好的分割精度,而且全尺度模块网络达到了实时分割的实验要求。本文的主要研究成果包含以下两个方面:第一:提出边界嵌入卷积神经网络,并且实现了精准的语义分割结果。由于卷积核的固定结构、卷积核的刚性结构和下采样操作,深度神经网络在提取特征过程中会丢失部分空间信息和位置信息,使得深度神经网络在网络深层的会丢失部分空间信息和位置信息,这导致了分割结果的边界轮廓不显著。因此本研究提出了一种边界嵌入卷积神经网络,该网络由边界嵌入卷积核结构和边界嵌入平均池化结构设计构成。该方法将边界信息作为先验知识嵌入网络中,这种先验知识的嵌入会有效的补充边界信息,同时相较于标准卷积核和标准平均池化结构,边界嵌入卷积核结构和边界嵌入平均池化结构几乎不会引入网络参数。为了验证模型的先进性和高效性,在Cityscapes数据集和Pascal Voc2012数据集都进行了实验论证,并且取得了良好的成绩。第二:对于语义分割边界轮廓信息表现不显著,弱纹理,低分辨率等问题,本文设计出全尺度模块,采用多组空洞卷积串联,使得全尺度模块获得多个不同的感受野,同时为了更好地筛选特征从而控制不同尺度感受野的权重大小,所以本研究又增加了注意力机制。该方法在Pascal Context数据集和ade20k数据集上都取得了较好的性能。此外,全尺度模块还在医学分割数据集ISBI2017进行了实验验证并取得了良好的实验效果,这证明了该模块不仅仅适用于自然图像的语义分割,同样适用于医学图像的分割。虽然深度卷积神经网络在图像分割中有着重要的意义,但是网络运行时间长,难以达到实时的要求,无法满足一些移动端的轻量级要求。本文全尺度模块采用深度可分离卷积,构成轻量级多感受野结构,最后本研究在保证实验基本精度的同时,提高了网络的运行速度,并且达到了实时的分割速度。
其他文献
湍流大气中的光传输不仅涉及到随机介质中波传播理论,还涉及到大气湍流的复杂特性。随着高分辨成像技术以及计算机技术的不断发展,利用大气湍流激光传输成像方法,可以更加直观地获得大气湍流的时空分布变化特征,了解和掌握激光大气湍流传输效应以及湍流强度等信息,目前该方法的探测目标多为光学湍流特征量,而鲜有动力湍流特性表征量。常用的大气湍流激光传输成像实验多采用一端发射激光、另一端以漫反射屏接收激光光斑并拍摄记
道路作为城市的重要部分,改变了城市下垫面的组成。在城市化的进程中,城市道路建设事业得以快速发展,道路网越来越完善,故道路的覆盖范围大幅增加。反过来,道路空间格局也可以反映城镇化的程度,在城市化的研究中有着重要的作用。高速发展的道路交通在为人类提供了便利的同时,对城市的生态环境也产生了影响,如对地形地貌、土地覆盖等都产生了或多或少的影响。因此,监测城市道路的变化特征,对城市化和环境研究都具有重要的现
在现代计算机体系架构中,I/O设备的性能越来越备受关注,I/O虚拟化技术的产生,使得I/O设备的利用率和性能飞速提升。而基于硬件辅助I/O虚拟化技术的实现,使系统整体性能又向前迈进了一大步。传统I/O虚拟化通过软件干预会使系统多次进行上下文切换,容易形成通信瓶颈,导致CPU和大量的内存资源被浪费,基于硬件辅助I/O虚拟化技术克服了传统I/O虚拟化通过软件干预的缺点,并且是通过专用的硬件模块实现I/
比色传感和光电化学传感的概念自提出以来受到了广泛关注。近年来,通过将先进的纳米技术、界面组装方式和多样的识别反应相结合,比色传感和光电分析方法的灵敏度和选择性得到了极大的提高,应用范围也扩展到了生物识别、重金属离子以及农药分子检测等领域。随着比色传感器和光电化学传感器的发展,研究者们逐渐聚焦于光敏材料的发掘和改性以及构建具有制造成本低、器件小型化和使用便捷等优点的新型传感器。本文基于离子交换策略,
玉米是我国重要的农作物之一,在玉米生长过程中,可以通过无人机拍摄玉米植株图像,利用计算机视觉技术对植株进行计数,以估计玉米总产量,并制定下一年的育种计划。然而,实际拍摄得到的玉米植株图像,会受到光照反射、背景相似等不利因素的影响,降低了植株计数的精度,影响了玉米植株分布情况的正确显示。针对上述问题,本文开展了以下两部分工作。(1)提出了一种基于改进YOLOv3的玉米植株计数算法。首先,对训练集中的
基于深度学习的汽车智能座舱系统旨在使用计算机视觉技术构建更加智能、安全的驾乘体验,其中,人脸活体检测技术和视线估计技术是该系统中的两个重要方向。但是从目前的研究而言,人脸活体检测和驾驶员视线估计在智能座舱中的应用还并不成熟,原因是一方面,普通RGB相机捕捉不到人脸的深度信息以及对单一模态数据的建模很难达到理想的效果,导致现有的活体检测模型在实际环境下鲁棒性普遍偏低,从而给人脸识别带来了安全隐患。另
软件定义网络(Software Defined Network,SDN)是新一代计算机网络架构。凭借数据转发和逻辑控制相分离的优势,软件定义网络相比传统网络能更快速地响应用户请求。同时,网络可编程特性则使其能方便地实现诸如负载均衡等复杂网络功能。然而,因为整个网络的逻辑控制功能都集成在逻辑控制平面,该平面发生故障将影响整个网络的性能,严重时将使整个网络瘫痪。针对控制器的分布式拒绝服务(Distri
人工智能作为一个曾经让人感到很遥远的词,往往只出现在各种影视作品中,然而现如今,这个词已经渐渐的深入到我们的生活中来。商品识别,人脸检测,面容支付,语音控制等等这些基于人工智能的技术极大的方便了我们的生活。而这些技术的发展也离不开优化的算法,诸如卷积神经网络的不断发展以及具有强大算力的硬件设备的支持。随着所需处理的数据量愈发庞大,目前的冯诺依曼结构由于速度的限制可能在不久的将来成为人工智能发展的瓶
科技的飞速发展促进了新兴技术被广泛的应用到人类的日常生活中,然而应用程序需要处理的数据量也随之陡增。由于内存技术的发展趋势不能像计算性能那样迅速扩展,从而导致了所谓的冯·诺依曼内存墙。为了解决“内存墙”及其带来的一系列问题,学者们提出了一种新型计算架构-存内计算架构。本文首先介绍了半导体行业发展的背景和现状,并从SRAM(Static Random Access Memory)存储单元着手,详细介
随着云计算技术的不断成熟,基于服务的系统(Service-Based System,SBS)正在快速增长,SBS根据业务流程的形式组合现有的服务为用户提供服务。但是这种架构也给系统的容错带来了更复杂的问题。在动态的云环境中,SBS的组件服务可能会遇到由于各种运行时异常(例如虚拟机故障、软件异常等)而导致的多维度服务质量(Quality of Service,QoS)下降的情况。及时且经济高效地处理