基于语义流对齐和注意力机制的实时语义分割算法

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:osinfobyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉中,语义分割作为一个经典的研究方向,其任务是对图像分配像素级标签。在深度学习思想的影响下,语义分割技术发展迅速,在视频监控,自动驾驶等领域发挥着潜在的作用。而现有的语义分割方法通过构建复杂的模型,尽管达到了高精度的要求,但是存在复杂模型参数多,分割速度较慢的问题,无法达到很好的实时性。而在语义分割的实际应用中,通常需要处理一些高分辨率图像,如何更好地保持实时性和准确性显然是一个极其重要的问题。基于以上分析,设计了一种基于Deep Lab V3改进的实时语义分割算法,具体研究内容如下:(1)对Deep Lab V3网络结构进行改进。原有的Deep Lab V3网络结构分割精度较高,但参数量庞大,不满足实时性的要求,因此选用Mobile Net V2的轻量级架构作为特征提取网络,有效降低参数量,并优化Deep Lab V3中的空间金字塔池化模块,使用1×1的卷积降低通道数,同时普通的卷积被深度可分离卷积取代,进一步提升分割速度。(2)语义流对齐模块。在语义分割中,高层低分辨率特征包含很强的语义信息,而缺失细节,而低层高分辨率特征表现出很好的细节信息,语义不明显,因此,融合高低层特征是一种常见的解决方案。但是高低层特征直接融合时存在像素偏移的问题,针对这一问题,加入了语义流对齐模块。将两个相邻级别的高低层不同分辨率特征图传入语义流模块,该模块主要是利用特征图之间的语义流关系,达到像素对齐的目的,高层特征可以高效地向低层特征传入语义信息,实现基于语义流的特征图之间的特征融合操作。(3)注意力机制模块。注意力机制可以捕获更多的信息特征,从而增强其表达能力,因此在语义分割中得到了广泛应用。注意力机制可以对各个特征赋予不同的权重参数,从而使网络抑制对语义分割不重要的特征,更加关注重要的特征。在网络中加入双尺度注意力机制模块,可以获取双尺度的空间感受野信息,建立双尺度通道注意力的长期依赖关系,得到一个双尺度特征信息注意力加权之后的特征图,更好地实现注意力信息的交互。在Cityscapes,Pascal VOC2012和Cam Vid三种不同的数据集上进行实验,结果显示,算法的分割精度m Io U分别达到了73.2%,73.5%和75.0%,分割速度FPS分别为50,97和90。总体而言,该算法在语义分割中可以很好的兼顾准确性和实时速率,达到实时语义分割的要求。
其他文献
船舶一般长时间航行于海上,通常远离陆地,如果船上的电子设备发生故障,船员维修非常困难。特别是对于自动操舵仪来说,若发生故障而不能及时修复,将严重影响船舶航行。本论文针对这一情况,设计了一款自动操舵仪故障诊断系统,普通船员操作使用该系统就能实现自动操舵仪的维修。本论文针对自动操舵仪系统特点,区分了系统线路的故障诊断和电路板的故障诊断。自动操舵仪的电路板不多,而且每块电路板都有备用板,船上一般很少需要
学位
随着互联网的普及和社交网络的兴起,中学生使用网络越来越普遍,问题性网络使用行为也越发严重。问题性网络使用是指过度使用网络而引起的一种着迷和依赖状态,对中学生学习、生活及身心健康的发展都有负面影响。网络世界的虚拟感影响着人们的交往价值观念和行为方式,导致个体产生人际困扰,又进一步导致更严重的问题性网络使用行为,产生恶性循环。基本心理需要与自我和谐是中学生心理健康发展的重要影响因素,反刍思维是学生认知
学位
随着时代的发展,人们利用科学技术对疾病的认识在不断深入,同时也使人类的寿命较17、18世纪有了延伸。目前,癌症是全世界公认的致死率最高的疾病,其中肺癌是全世界癌症死亡的主要原因。肺结节是指肺部计算机断层扫描(CT)显示为类圆形阴影的一系列肺部异常,肺结节的准确生长率是肺癌诊断的重要指标。因此,获得肺结节面积或体积信息成为肺结节准确生长率的必备前提。利用三维计算机辅助诊断技术帮助医师进行肺结节的分割
学位
长三角一体化发展正在步入“快车道”,同时也是我国整体经济高质量发展的重要推动力。文章运用PEST模型深度挖掘了长三角一体化背景,在此基础上指出了长三角一体化发展所引起的相关效应和问题,并以新发展理念作为切入视角,提出了具有实际意义的建议,以供参考。
期刊
春玉米秸秆还田是寒旱区保护性耕作的核心技术,同时也是改善土壤结构,增加土壤肥力的重要措施。团聚体是表征土壤结构的重要指标,土壤碳库管理指数是反映土壤肥力的重要指标,研究秸秆还田方式对土壤团聚体及碳库管理指数的影响,能够为优化冀西北寒旱区秸秆还田方式提供科学依据。本文采用秸秆还田翻耕(JF)、秸秆还田旋耕(JX)、大垄轮播秸秆还田(JL)3种还田方式,以秸秆不还田为对照(CK),通过分析三种还田方式
学位
视觉工作记忆与选择性注意一直是认知心理学中的重要研究领域,尽管已有研究分别为视觉工作记忆编码阶段存在基于客体的注意选择模式和维持阶段存在基于特征的注意选择模式提供了证据支持。但是这些证据来自不同的研究,它们之间的研究范式、客体特征维度以及反应指标都存在差异,因此我们必须谨慎地得出视觉工作记忆不同加工阶段存在不同注意选择模式的结论。本研究采用变化觉察范式,将“任务无关特征变化干扰效应”作为观测指标,
学位
学位
草地贪夜蛾Spodoptera frugiperda(Smith)隶属于鳞翅目Lepidoptera夜蛾科Noctuidae,是原产于美洲的重大迁飞性农业害虫,2019年在我国云南首次发现该虫危害新鲜幼嫩的玉米叶片,并由南向北迅速蔓延,严重影响我国玉米的产量,对我国的粮食生产安全造成长期性威胁。目前,化学防治仍是草地贪夜蛾的主要防治方法,而新型纳米农药具有生物活性强、利用率高、持效期长、吸附能力强
学位
软件质量保证活动是软件开发过程中的重要环节。为了在保证软件质量的同时最小化测试成本,软件缺陷预测技术成为了软件工程领域的研究热点。基于被测软件实体大小的不同,缺陷预测技术主要分为粗粒度缺陷预测(文件、模块或者包)和细粒度缺陷预测(变更)。变更级缺陷预测是在开发者提交代码时,预测本次提交的代码变化是否存在缺陷的技术,又称为即时(Just-In-Time)缺陷预测。相比于粗粒度缺陷预测,即时缺陷预测技
学位
海洋蕴藏着巨大的资源,引起了全世界人们对海洋的探索。但是由于强烈的光吸收和散射,不同波长的光会以不同速率发生衰减,使得在水下获取的图像存在颜色失真,对比度低,可见性明显下降的特征。因此,一些在水下活动的探索面临着极大的困难。如何获得清晰的水下图像,成为了目前一项极具挑战性的任务。围绕这一任务,水下图像增强技术得到快速发展,包括基于传统的方法和基于网络的方法。其中传统方法过于依赖模型,参数求解要求严
学位