可微分网络架构搜索在图片语义分割特征融合的研究与应用

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:between930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间和语义信息的特征融合对于实现高性能的图片语义分割(Image Semantic Segmentation)十分重要。快速语义分割任务要求网络模型的计算复杂度较低,网络包含多个分支需要接入特征融合模块,对研究人员高效设计特征融合结构提出了挑战。近年来,神经网络结构搜索(NeuralArchitecture Search,NAS)在自动网络设计方面取得了较好的效果。并且,因其辅助研究者设计网络架构,减少对人工设计依赖获得广泛关注。其中,可微分网络架构搜索相比于其他基于强化学习、遗传算法等优化方法的搜索方案具有搜索成本较低且候选架构评估效率较高的特点。近年,多层特征融合结构在目标检测和高精度语义分割等计算机视觉领域被证明能够提高标签预测的精度。然而,多层融合由形式重复的结构重复堆叠形成,结构较复杂,多变的层间特征融合连接结构加大了研究者的设计难度。而且,多层特征融合结构在快速语义分割特征融合模块的设计上应用较少。为了自动搜索高效的快速语义分割特征融合模块,本文改进可微分网络架构搜索并应用,主要工作如下:(1)拓展引导融合模块,实现多层引导特征融合结构。快速语义分割的双分支模型存在一种单层引导融合模块,能够促进分支之间更好学习不同信息的特征表示。结合多层融合思想,将引导融合从一层拓展到N层,将各层输出特征图以特征共享连接的形式向后继层输出,设计提高语义分割精度的融合模块。为了提高特征共享结构的训练效率,为该结构添加引导融合的跨分支连接以及层间跳连接。(2)应用面向特征融合的可微分网络架构搜索方法(MTL-NAS),自动生成特征共享连接。对于快速语义分割的双分支模型,合并具有不同结构和职责的分支输出的不同尺度特征图可以近似看作两者实现精细语义分割合作。这种合作关系需要一个更合理、更有效的融合结构来提高精度。应用MTL-NAS自动搜索多层特征融合结构嵌入到已有的人工设计模型中。在Cityscapes数据集上测试的实验结果表明,搜索到的模块可以提高准确性。对于FastSCNN、ContextNet和BiSeNet,mIoU 的提高分别为 2%、2.5%和 1%。(3)搜索低计算复杂度多层引导特征融合结构。通过为搜索算法的改进损失函数以限制特征融合的连接数,降低计算复杂度。本文改进搜索空间,实现具有较少连接的多层特征融合。
其他文献
伴随5G时代的来临和物联网科技的蓬勃发展,大规模数据密集型应用迅速兴起,数据处理需求迅猛增长,但是移动设备的计算能力、电池及任务处理能力并没有跟上数据密集型应用发展的脚步,处理数据时面临着巨大的挑战。传统云计算模型存在宽带负荷高、计算资源浪费、隐私保护、延迟及能耗较大等不足,而移动边缘计算(Mobile Edge Computing,MEC)则凭借实时处理的低时延、低能耗、安全性高、协同执行等特点
学位
近年来,城市交通拥堵问题得到了广泛关注,交通治理越来越受到管理部门的重视。随着自动驾驶和智慧城市研究的发展,及时、准确的道路交通信息预测对于交通管理、交通规划和交通安全来说都至关重要。然而及时准确的道路交通信息预测面临着非常大的挑战。首先,道路交通流规律是随着时间的变化而变化的,其变化的规律不是平稳的。比如说工作日和非工作日的交通流变化规律,早高峰和晚高峰的交通流变化规律,早晚高峰与平时的交通流变
学位
“互联网+教育”的模式改变了传统教育一师一书一间教室的模式,打破了时空限制,为高质量教育的实现带来契机。但是高质量教育的实现,重点在于区域协调发展,在于学生的个性化发展。藏族地区是目前教育资源匮乏,教育质量相对落后的地区,教育模式依旧是单向的灌输式教育,导致学生学习兴趣不高,影响学生的个性化发展。其次在藏族地区,由于多种因素的影响,导致目前使用藏方言的人数正在削减;并且不同的地区使用不同的方言,阻
学位
有机无机金属卤化物钙钛矿太阳能电池(PSCs)近些年来受到太阳能电池领域研究者的广泛关注,其光电转换效率已从2009年的3.8%增加至如今的25.7%,效率发展十分迅猛,使得PSCs有望成为低成本光伏技术的典型代表。随着性能逐步提升,PSCs中的光学损失越来越成为制约器件效率的关键。本文围绕可印刷介观钙钛矿太阳能电池(p-MPSCs)中的光学调控展开研究,对其进行了光学损失分析、光学损失优化和光谱
学位
“叙事”是人们对时间的基本组织原则,而在这一原则之下,人们通过话语来完成自我的构建。在叙事的过程当中,由于人的叙述,故而进一步完成着人格的构建。在此之中,“叙事心理学”正是把人们的生活故事当做心理学的主要研究对象进行分析与讨论。舞蹈作为一种“长于抒情,拙于叙事”的艺术门类,其虽然“拙于叙事”但并非不能叙事。在人物形象塑造的方法论方面,主要以戏剧理论或影视表演理论为基础,并在此基础之上借鉴文学、心理
学位
本论文以“基于‘历史关联’的高中古诗词教学个案研究”为题目,以“历史关联”的古诗词为研究对象,阐释了“历史关联”的内涵及其在古诗词教学中的作用,通过对湖北省X中学的古诗词教学现状进行调研,分析了该校在基于“历史关联”的古诗词教学中存在的问题,并针对这些问题和成因提出了相关的教学建议,旨在让高中生在古诗词学习中能够强化“文史贯通”的意识,为诗词鉴赏提供新的角度和方法。本论文共分三章:第一章是对基于“
学位
情感计算是实现高级人机交互的核心技术之一,它随着深度学习、人工智能的高速发展,受到了广泛的关注,不断地被研究者研究。情感的表述方式多种多样,基本可以分为生理信号和非生理信号两大类。常见的非生理信号有语言、文本、面部表情、身体姿势等;生理信号主要有脑电、心电、肌电、表皮电阻、表皮电流、光电脉搏、呼吸信号等。在非生理信号中,表情是最直接的一种表达方式。在生理信号中,脑电信号与情感的联系较为紧密。关于表
学位
金课建设的提出为高校人才培养打下坚实基础,同时为实施课程思政教学改革提供了良好的基础环境。通过对通信原理课程思政实践研究现状的分析,提出金课建设背景下通信原理课程思政教学改革方案并进行改革实践,采用视频互动教学、案例教学、微课教学等多种教学形式,力求人才培养和思政教育同步推行、目标双至。
期刊
在自然语言生成任务中,词汇选择(lexical choice)是其中的一项子任务,其目的是根据上下文选择恰当的目标词表达相应的语义概念。在实际的词汇选择问题中,对于同一个语义概念,常常有多个意义相近的词可供选择,这些近义词分别在外延、内涵等方面有细微的差异,若能从多个近义词中选择出恰当的目标词则可以生动的表达相应的语义概念,进而提高自然语言生成系统的质量,提升用户的使用体验。随着科技的发展和社会的
学位
藏语历史发展悠久且应用广泛,是藏族人民日常生活中的主要语言,是保持民族团结和促进藏区经济发展的重要纽带。小学藏语文是藏族地区义务教育的重要课程,而藏语文阅读是小学藏语文教学的重要组成部分,通过藏语文阅读教学,可以让学生对藏族历史有更深的理解,对传承藏语言文化和科学保护藏语具有重要的价值。目前,藏语教学在师资力量、基础资料、题库储备等方面相对薄弱,相比汉语文教学,藏语文阅读材料相对不足。此外,藏语地
学位