基于深度学习的实时语义分割算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:aptx4866
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割问题是当前计算机视觉研究的重要且前沿性的课题。近年来,伴随着卷积神经网络理论的不断发展和广泛应用,以及计算机高性能计算单元的进步,基于深度学习的语义分割算法逐步走进人们的视野中,并在自动驾驶、机器人、医学图像处理、地理图像信息系统等领域发挥了重要作用。语义分割通常分为高精度的语义分割和实时的语义分割,两者的区别在于处理图像的速度和精度上的侧重点不一样。语义分割是一种密集预测任务,旨在为图像中的每一个像素分类。在训练过程中,图像经过网络模型输出为一个张量,再通过交叉熵损失函数优化模型。大部分的网络模型是基于分类主干网络或者从头设计的模型,考虑到算法的实用性,具有实时性的网络模型更有优势。实时分割算法基于编码器解码器或双分支架构,其中轻量级编码器起到了关键作用。实时分割算法通过对网络实现细节优化,如卷积过程、上采样下采样过程,加速网络推理速度的同时保证一定的精度。本文针对现有的语义分割算法模型过于复杂,计算过于耗时而无法应用在自动驾驶、场景理解等需要实时响应领域的问题,提出了一种新的轻量的基于注意力机制和扩张卷积的实时分割算法。首先,编码器部分设计了一个高效的特征提取模块,它包含了非对称并行的带不同扩张因子的卷积模块,在增大感受野的同时保留了局部的细节信息。通过叠加这种结构,网络不需要添加特殊设计的多尺度语义信息提取模块。同时在解码器部分,利用两种不同的注意力模型去融合网络中不同层产生的特征图信息。算法模型在公共数据集cityscapes和camvid上进行了验证,在cityscapes测试集上m Io U达到78.05%,帧速率达到30.5帧/s。在camvid上m Io U达到76.52%。同当前的其他实时语义分割方法相比,该网络性能更优。
其他文献
肺炎是一种多发且严重的感染性疾病,可发生于任何年龄阶段,严重影响患者的生命健康,因此,肺炎的早期发现以及治疗是非常重要的。然而肺炎图像的结构复杂性、灰度分布不均匀等问题严重影响了肺炎分类的准确性。传统的肺炎分类主要依靠有经验的医生,其分类结果易受主观条件的影响,准确率得不到保证。近年来伴随着深度学习的发展,卷积神经网络被广泛地应用于肺炎图像分类。作为经典的卷积神经网络,Dense Net网络由于在
学位
随着3D扫描技术等非接触测量技术的快速发展,点云表示3D形状已被接受为曲面的常见描述,这催生出了相关的数字化建模方法。但至目前,一般的表面配准和曲面拟合等方法虽然可以较方便地实现曲面的参数化建模,但不适用于处理医疗和康复领域中常见的精细化、精准化定制设计任务,如医用压力袜的设计任务。这是因为这些方法往往需要较多的特征点来提高形状表示的平滑度与光顺性,这将不可避免地导致精度和计算效率之间的平衡困境;
学位
数字信号处理(Digital Signal Process,DSP)+可编程阵列逻辑(Field Program Gate Way,FPGA)正在广泛应用于复杂的数字信号处理领域。针对DSP与FPGA单个处理器性能有限、不够灵活等问题,提出DSP+FPGA架构的系统设计方案,基于TMS320C6748(DSP)和EP3C40Q240C8N(FPGA)芯片的外部存储器接口(External Memo
期刊
<正>本文通过对我国31部省级“十四五”档案事业发展规划的分析,解读“十四五”时期我国档案事业发展任务与重点,为未来五年我国档案事业的发展提供参考,提出未来主要从服务中心大局与民生、加强数字转型、推进档案文化建设、确保档案安全、助力区域协同发展等方面促进我国档案事业的高质量发展。
期刊
人工智能推动多行业智能化发展,如生物医学,计算机视觉,油气工程开发等,而偏微分方程求解始终是其中研究的热点问题。传统的数值求解方法因计算量大,网格生成开销大等原因限制了其发展。本文围绕非稳态偏微分方程求解问题展开研究,主要创新点和研究工作主要有以下三点:(1)针对三维非稳态偏微分方程问题,本文提出了3D-PDE-Net求解方法,结合小波分析中消失矩理论和泰勒展开定理,从理论上证明三维卷积核在表达能
学位
煤层气是一种非常规天然气,其燃烧后不产生废气,是一种清洁能源,但其在开采时难度较大,需要使用先进的工艺进行钻井开发。本文就煤层气多分支水平井钻井工艺进行研究,对钻井过程中的难点和问题进行分析,探究煤层气开发工艺措施,旨在提高煤层气开发效率,不断提升实际的勘测技术水平。
期刊
结合工业机器人应用编程职业技能等级证书试点,阐述了在1+X证书制度试点初期存在的一些问题,并以工业机器人技术专业试点"工业机器人应用编程"技能等级证书为例进行试点探讨,指出了目前证书试点过程中所存在的一些教学问题,并针对相应问题提出了试点实施的具体思路。
期刊
数字岩心重建技术可以在孔隙尺度上描述岩石的微观结构,已经成为定量分析岩石物理特性和孔隙分布、模拟纳米孔内流体流动的关键。数字岩心是孔隙级微观渗流理论研究的基础平台,能够可视化和定量化岩心样本并有效描述储层岩石孔隙空间情况、研究储层内部的流体运移机制。传统的数字岩心建模数值重构方法如多点地质统计法、模拟退火法等,重构时间长,效率低,对岩心样本的要求高。而生成对抗网络(GAN)作为一种新的数值重建法,
学位
可展曲面可以在没有伸缩和撕裂的状态下展开到一个平面上,在建筑业和产品制造等领域具有广泛的应用,因此可展曲面的构造方法一直是曲面几何设计领域学者们重视的问题。在微分几何中,测地线、渐近线、曲率线是曲面上三类重要的内蕴几何特征线,它们在整体或者局部上影响着曲面的性质,因此由给定的一条具有内蕴几何特征的特征线来逆向设计所需参数曲面束是新兴的研究热点。在欧式空间中,关于插值特征线构造可展曲面的研究有很多,
学位
我国有庞大的听障人士群体,手语是他们与外界沟通交流的主要渠道。如何从手语手势动作中识别听障人士想表达的内容,是减少听障人士和健全人之间沟通障碍的关键。目前的手语手势识别方法有一些局限。如,只用单一模态的信号采集手语手势,无法获取手势动作中的全部信息;只关注手语手势动作所代表的语义信息,而忽略了听障人士手语动作中反映的情绪状态;由于手语使用对象和语境的变化,导致缺乏跨域的泛化性,在新数据集中模型识别
学位