基于多尺度特征融合的语义分割方法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:zhaoshuang1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是计算机视觉领域的基础任务之一,其应用场景十分广泛,医疗成像、自动驾驶、场景解析等相关任务都要用到语义分割的相关技术,构建精准、高效的语义分割模型对我们的生活而言显得尤为重要。目前基于深度学习的语义分割方法大都通过增加网络层数、扩展网络宽度、提取上下文信息、捕获全局先验信息等方式来获取性能上的提升。虽然以上方法可以提升最后的语义分割效果,但都忽略了多尺度特征信息对于全局像素语义的重要性。因此,本文对多尺度特征融合方法进行了深入研究,基于此提出了性能更优的图像语义分割网络。本文提出了基于编码-解码结构的多尺度特征融合的语义分割网络。针对语义分割任务,在网络的编码部分设计了三个不同的特征提取模块(Feature Extraction Module,FEM),分别为FEM-A、FEM-B、FEM-C,三个模块分别应用于不同的网络层。对于浅层网络而言,特征提取模块可以提取更丰富的特征信息,对于深层网络而言,该模块可以帮助网络实现多尺度特征信息的提取,进而得到更具代表性和判别性的特征信息。在网络的解码部分,为了充分利用多尺度特征信息实现细节信息的恢复,设计了多级特征融合模块(Multi-level Feature Fusion Module,MFFM),该模块首先采用级联方式对编码部分的特征进行多尺度特征融合,然后将融合的特征输入解码部分得到精准的特征信息表达。该网络在多个数据集上进行了测试验证,从实验结果可知该网络的性能较其它语义分割网络有了显著提升。本文提出了基于膨胀卷积的多尺度特征融合的语义分割网络。为了突破传统卷积的限制,本文在注意力机制的基础上,提出了非局部注意力模块(Non-Local Attention Module,NLAM)并将其嵌入网络中,该模块可为整个网络获取非局部的特征信息。为了从多尺度特征信息中抽取更具表示性的特征,设计了基于膨胀卷积的多尺度特征重组模块(Multi-scale Feature Recombination Module,MFRM),分别为MFRM-A、MFRM-B。这两个模块能分别对不同尺度下的特征信息进行处理和融合,实现多尺度特征信息下的相互选择,进而获取更精确的信息表达。针对上采样操作,为了实现更好的上采样效果,设计了特有的密集上采样模块(Dense Upsampling Module,DUM),该模块可在原有特征图上恢复更多的细节信息。本文通过构建系统性的消融实验探究各模块对网络性能的影响,从实验结果可知各模块均有助于网络性能的提升,整个网络和其它语义分割网络相比,性能显著提升。
其他文献
本纪录片的片名与南昌航空大学的一部校园原创话剧同名,纪录片与话剧的内容都是围绕着陆孝彭先生的生平事迹展开的。二者都叫《归来》,讲述的是“强-5之父”、中国工程院院士、南昌航空大学首任校长陆孝彭先生,在青年时期经历日军轰炸,立志航空救国,后辗转英美学习先进的航空工程技术,多年后,毅然放弃国外一切优渥待遇,突破重重阻难回到大陆报效祖国的感人故事。纪录片《归来》主要想通过话剧重温历史事件,把历史的故事讲
学位
<正>随着小学数学课堂教育改革的不断深入,对教师的教学质量要求也在不断提升。素质教育要求培养学生的独立思考能力,增强学生的学科核心素养。数学教师应积极创新课堂教学方法,从学生的兴趣出发设计教学内容,激发学生的求知欲,并鼓励学生质疑、探究,从解决问题的过程中提升数学的学习水平,培养学生的独立思考能力。其中,独立精神指的是人在思考问题时能突破传统思维,不照搬他人模式,根据实际情况来思考问题并制定相应的
期刊
泥土滋养万物、繁衍生息、诞生文明,在中华文明历史的发展进程中占据着举足轻重的地位。泥土从为人类提供最基础的衣食住行开始,逐渐演化为泥塑上升到一门艺术种类。从造型到使用价值,泥塑作为中国古老而又独具特色的民间艺术,承载着人们生活、生产、祭祀等重要的历史与文化传承。专题片《生而为泥塑者仁心》是一部讲述民间手艺人杨会民关于创办、传承杨氏泥塑的作品。杨会民师承于三痴斋泥塑大师宋寿富,凭着对泥塑艺术40多年
学位
想要让学生在小学数学的学习中具有较高的学习能力,就需要从小学低段对其进行数学独立思考能力的培养,因此,在如今的数学教学中,教师不可再按照传统照本宣科的方式进行教学,打造民主和谐的教学氛围才是如今小学教学的导向和目标,从而实现学生在课堂中的主体地位和课堂参与度,引导学生自主分析问题和解决问题,并由此提高学生的数学综合能力。
会议
纪录片作为文化传播的载体,越来越多地出现在人们的视野中,承担着传播社会主流价值观的重要作用。人物纪录片作为纪录片的一种类型,可以使观众超越当下的生活空间,打破时间、地域的桎梏,了解纪录片主人公的生活状态,感受他们的喜怒哀乐,从而达到情感上的共鸣。本毕业设计作品为人物纪录片《吧赫西点店》,将镜头对准一位在中国扎根19年致力于助残事业的德国人吴正荣。本作品阐述报告将以毕业设计作品人物纪录片《吧赫西点店
学位
“以人为本”展开叙事的人物纪录片,作为纪录片创作的重要类型,往往更能引起观众的共鸣。影片《破茧》从两位年轻的杂技演员——邓李想和潘玮翔入手,围绕中国传统技艺“杂技”展开叙事。本毕业设计旨在将男女主人公不同的“梦想”整合呈现,即融入杂技班,完成一场精彩的演出和完成爸爸的遗愿。影片力图传达人物在“破茧”路上永不言弃的精神和对杂技技艺的坚守与传承。在内容安排和叙事结构上,运用“线性”结构、交叉式手法叙事
学位
卷积神经网络很适合处理与数字图像相关的任务。但目前常见的卷积网络框架并不能很好地处理具有多个通道的数据,例如彩色图像。多通道数据在通道之间有着非常紧密的联系。但利用卷积网络处理多通道数据时,常会将其视为多个单通道数据分开学习,这就丧失了通道之间的相关性,从而陷入性能上的瓶颈。而超复数是解决此问题的一个具有潜力的工具,它的特点是包含不止一个虚部单位,所以先天具有对多通道信号的编码能力,这种优势是实数
学位
每个人都有属于自己的记忆。而一个地方,也有着一群人共同拥有的记忆。这种记忆,演化成地域的文化形态,成为一种恒久的文化能量。莱芜地处鲁中,有着丰富多彩且极为珍贵的地域特色文化资源。它是千百年以来形成的文化积淀,是人们彼此认同的有形无形的真实存在,也是当今社会发展的独特推动力。俗话说:“一方水土养一方人,一方文化培育一方精神。”一个地方有一个地方的特质文化,在莱芜,正是具有莱芜特质的文化形成了现在的莱
学位
人体姿态估计是指在给出的图像数据中准确定位出人体的各个关键点,比如肩部、头部、肘部,将定位出的关键点按人体结构进行连接,形成人体姿态的过程。人体姿态估计是计算机视觉中极具挑战性的任务,在人机交互、智能安防、行为识别等领域都有着重要的应用价值。近些年,随着深度学习方法的引入,深度神经网络结构的不断革新致使人体姿态估计算法在性能上有飞跃式的提升。本文从改进深度神经网络结构的角度出发,分析人体姿态估计任
学位
文化自信三大源泉包括中华优秀传统文化、革命文化和社会主义先进文化。对革命文化中的传播者——如红色纪念馆讲解者——为纪录片创作对象,成为新时代红色文化类纪录片创作热点之一。红色文化传播者对我国特殊时期革命故事的传播发展有着极其重要的作用。老一辈革命家对革命故事的传播方式是如何“坚守”与“传承”表达并记录的,截至目前仍没有一部影视作品以个体为例具体的展现家族对红色文化的传承。本文创作阐述总共分为五个部
学位