基于混合自注意力机制的城市场景语义分割算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:cnzzzbjzbgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割任务要求对输入的图像标注其所有像素的类别信息。它是一种密集型的分类任务。作为计算机视觉领域近些年来兴起的热门研究方向,语义分割技术借着深度学习与硬件计算设备进步的东风快速地发展了起来,广泛地应用于智能驾驶、医疗影像等领域之中。现实场景中,由于城市环境的复杂性,智能驾驶应用的安全性与实时性的要求,此领域的语义分割技术在同时保证精度与推理速度上面临着巨大的挑战。因此如何优化语义分割网络结构,提高网络的特征提取能力、降低其高计算力的要求是目前研究的重点。本文以用于语义分割的全卷积神经网络相关算法为研究基础,重点研究了使用注意力机制对语义分割网络精度的提高效果。提出了基于混合自注意力机制的语义分割算法,在城市场景数据集City Scapes上验证了它的效果。针对网络实时性差的问题,提出一种基于双流结构改进的实时语义分割网络。本文主要内容如下所述:(1)基于混合自注意力机制的语义分割网络:为了提高骨干特征提取网络的特征提取能力,我们将混合注意力模块(CBAM,Convolutional Block Attention Module)融合进了Res Net18的各个单元中,让其拥有了自适应性的注意力权重学习能力。为了提高解码器阶段的特征融合能力,我们将自注意力模块(SAM,SelfAttention Module)加入到了上采样的过程中。但是传统的Non-local操作在高分辨率的特征图处理上需要十分巨大的显存与超长的推理时间。针对这个问题,我们提出了一种基于像素聚集重组的自注意力模块,降低了自注意力模块的显存需求,提高了其推理速度。降低了冗余计算的同时基本保证了自注意力模块的精度提升效果。在经过注意力优化模块(ARM,Attention Refinement Module)的优化下融合多层特征产生了最终的输出。借此我们搭建了混合自注意力机制的语义分割网络。在City Scapes数据集上MIo U达到了75.6%,FPS维持在了63。(2)基于混合自注意力机制的实时语义分割网络:在实际场景中,对于语义分割网络的实时性要求可能比准确度要求更高,于是我们借鉴了Bi Se Net中双流结构的设计,破除了传统的U型结构的设计,将原有的特征提取网络作为上下文信息提取分支,额外引入了一条空间特征信息提取分支。并且将前文所提到的多种注意力模型加入到网络中。减少了上采样的次数,使用特征融合模块(FFM,Feature Fusion Module)融合了两个分支的信息。我们在City Scapes数据集进行实验,取得了MIo U-74.1%、FPS-95的效果。相比于Bi Se Net的MIo U指标提高了1.8%,相比于前文所提出的网络MIo U虽然精度损失了1.5%,但是换来了FPS-32帧的提升。我们也在Cam Vid数据集上进行了同样的测试,取得了MIo U-68.3%、FPS-106的效果。
其他文献
本文设计了一种使用在电动轻卡变速箱中的棘轮式可控超越离合器。在换挡过程中,通过控制该机构和摩擦离合器,解决了电动车两挡变速箱换挡动力中断问题,同时采用抬起棘爪的形式,避免了运行过程中不必要的磨损和噪音。并通过对棘轮式可控超越离合器的结构设计、动力学仿真分析、接触强度分析来研究离合器的性能,通过对变速箱整体模型仿真,验证其无动力中断换挡的特性并针对车辆冲击度进行结构优化。主要研究内容如下:1.简述了
研究背景:特发性膜性肾病(Idiopathic membranous nephropathy,IMN)是一种病因及发病机制尚不明确的自身免疫性疾病,近年来,其发病率逐渐升高且趋于年轻化。其临床严重程度与预后密切相关,一直是国内外学者研究的重点。IMN患者长期预后良好,但IMN的临床表现可演变为三种不同的临床情况:没有任何免疫抑制治疗下发生自发性缓解,大量蛋白尿伴肾功能恶化,或肾功能保留的持续性肾病
随着科技水平的不断提高,我国的航空航天技术已经迈入了新的阶段,卫星的相关技术有了长足的进步。目前已经掌握卫星发射全过程仿真和实验、收集分析卫星实际发射数据技术等,但是,依然有很多关键性问题有待解决。为保证卫星整体结构及搭载的微小结构和敏感元件正常工作,在设计结构时需要考虑卫星发射与返回阶段受到的减缓火工冲击。本文针对减缓火工冲击工况对卫星底部裙底结构抗冲击性能进行研究,在满足卫星实际需求的刚度、强
伴随着新兴互联网的蓬勃发展,工业5.0智能制造也逐步展开,工业物联网设备每天都会产生海量的数据信息。可面对日益增长的数据,如何从不计其数的数据中挖掘具备价值的信息,并加以利用反馈至决策层并做出调整,已经逐渐成为企业的迫切需求。为了解决这一难题,直观的图表工具逐渐进入企业的视野。图表将数据进行整合,能更加直观的分析查阅,以一种简单便捷的方式,将数据以图表的形式展现出来,使得决策端能直观的掌握最新的生
目的:评估经皮左心耳封堵术的安全性及有效性。方法:纳入2017年2月至2020年12月在吉林大学第一医院心内科接受经皮左心耳封堵术并完成术后门诊随访的患者。收集患者的临床病史资料,完善术前常规检查、经胸超声心动图及经食管超声心动图。左心耳封堵术后观察围术期(<7d)有无器械脱落、心肌梗死、中风、血管入路相关并发症、出血事件、心包积液、紧急心脏手术、死亡事件发生。术后1月、3月、6月、1年完成门诊随
在雾霾天气条件下,雾霾中的微小颗粒物不仅会对场景的反射光线进行散射和吸收,同样也会对一些大气光进行散射。因此,相机拍到的图像往往会面临对比度降低、图像细节损失等图像质量退化问题。由于物体的细节难以被识别和检测,这种低质量的有雾图像会严重影响一些高级视觉任务的精度,例如:目标检测、特征提取和目标跟踪。为了能够从有雾图像中恢复出清晰的图像,图像去雾算法在计算机视觉领域引起了人们的广泛关注,并被应用于一
背景及目的:1.PCNSL是侵袭性NHL,占结外NHL的4%~6%,发病率逐年升高。其恶性程度高,疾病进展快,预后差,在临床特点、诊断依据、治疗方案及预后影响因素方面均与其他类型NHL不同。2.本研究旨在分析吉林大学第一医院血液科PCNSL疾病特征;分析临床疗效与生存。资料与方法:1.本研究回顾性分析2009年3月1日至2020年11月30日于吉林大学第一医院血液科收治的71例PCNSL患者资料,
有机发光材料在诸多领域有着广阔的应用前景,如有机发光二极管、太阳能电池、场效应晶体管和有机传感器等。π-共轭分子构筑的有机晶体具有高度有序结构和高载流子迁移率,在有机光电材料领域引起了极大的关注。然而,传统的有机晶体在外力作用下容易发生破裂,很大程度上限制了它们的应用。近年来,人们发现某些有机晶体表现出特殊的机械柔性,这使其在柔性元件方面的应用得以发展。目前,有机柔性发光晶体的相关报道仍然较少,因
航天器中的柔性可展机构由于其功能要求和结构特点,一般都具有空间范围大,结构刚度低的特点。这导致微小的环境变化都会使结构产生大幅度的振动,这样的振动会对结构的稳定和精度产生影响,也会使结构过早疲劳损坏。旋转铰间隙在柔性可展机构中广泛存在,本文研究了旋转铰间隙的存在对柔性可展机构动态特性的影响。本文以含铰间隙的柔性可展机构为研究对象,用接触碰撞模型模拟旋转铰间隙处组件之间的作用效果,基于结构的柔性多体