基于多尺度探测与掩码评估网络的目标实例分割算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:birchwoods2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像实例分割是人工智能与图像识别领域的重要发展方向,其像素级的目标分割被广泛应用于工业生产、医疗卫生和社会安全等领域。传统图像实例分割算法容易受到目标形变、重叠、光照等因素的影响,其分割精度不高。基于卷积神经网络的特征提取方法虽然在目标检测、语义分割等任务中取得了较高的测试精度,但仍然存在一些问题。一方面,由于图像中目标尺度差异较大,导致检测精度降低,且分割结果不准确;另一方面,在语义分割阶段,池化过程导致特征图尺寸下降,像素点通过全连接层的映射和分类出现偏差,同时传统的实例分割模型不能对生成掩码的完整性进行评估,使得生成的目标掩码不准确。在现有实例分割算法框架的基础上,本文通过研究MTCNN和DNN等深度学习方法,以解决实例分割过程中目标尺度差异较大、掩码生成不准确的难题。本文的主要工作如下:(1)本文设计了一种多尺度探测器MSD(multi-scale detector),用于在特征图中提取不同尺度的实例目标特征,以消除目标尺寸差异较大的影响,提高实例分割精度。传统基于深度学习的目标实例分割算法在特征提取阶段通常使用单一的卷积核尺寸,难以提取特征图中不同尺寸的实例特征,并且在池化过程中大部分的小尺度目标易出现梯度下降的问题,从而出现目标定位不准确或误检的现象,给后续网络的分割任务带来了困难。为此,本文借鉴了人类视觉系统中的注意力机制,设计了一种残差结构与不同尺寸的卷积核相融合的多尺度探测器。该探测器作用于特征提取网络自上而下的路径中,为每次池化的结果提供完整的特征重构,这些重构后的特征向量形成了下一阶段的输入。MSD能够将不同尺度的特征进行融合,使卷积核的感受野范围更大,能够提取不同尺度的实例目标特征。为了进一步降低目标检测网络中输入图片尺寸比例不同所导致的识别精度降低问题,本文提出一种改进的空间金字塔池化方法。由于传统卷积神经网络的输入通常是固定的尺寸,导致训练样本中同一类别的实例目标发生不同程度的形变,且特征提取不完整,从而使识别精度降低。本文通过反卷积操作将局部特征映射到不同尺度的空间并将其融合,使卷积神经网络能够适应不同比例、多尺寸的图像输入。(2)在掩码生成网络中,将掩码生成网络提取的语义特征与特征提取网络中的类别特征进行多级融合,同时设计了一种基于掩码评估的掩码生成网络来提高实例分割的精度。掩码生成网络是实例分割的最后一个阶段,使用语义分割算法进行逐像素的类别判断。这种语义分割网络的输入通常为特征提取阶段的输出分支,由于特征图的尺寸小、维度高,损失函数对于该阶段的反向传播效果并不明显,导致实例目标部分遮挡或重叠情况下的像素类别判定不准确,特征图通过全连接层的映射不能够生成较为准确的实例掩码。本文首先采用特征融合的思想,将不同阶段的特征信息进行融合,作为语义分割网络的输入。同时使用掩码评估分数与掩码损失函数相结合对生成的掩码完整性进行评估,为掩码生成网络的权重进行进一步调整。
其他文献
随着我国工业化和城镇化进程的加快,农业的发展逐渐由传统粗放型农业向现代集约型农业转变,家庭承包经营责任制下土地细碎化、分散化经营和产业布局单一等问题日益严峻。农地
由于双足机器人腿部运动与地面间非连续性接触的特点,使得它对不平整地面环境的适应能力较强,灵活性较高,特别适用于灾后救援、丛林探险等复杂环境路面下的移动,是现阶段机器
随着科技的进步,机器人技术得到了快速的发展,其应用领域正逐渐扩展到各行各业中去。互联网技术的发展使得通过网络对机器人进行远程操控成为可能。远程控制技术极大的拓宽了机器人的应用领域,将网络远程控制技术运用到机器人控制领域中已经成为了一个重要的研宄方向。本论文的研究对象是实验室自行研发的多自由度护理机械臂。在对护理机械臂实现本地控制系统的基础匕对其远程控制系统进行了设计。其主要工作如下:首先,设计了护
经过近些年来的探索,我国PPP项目发展日益成熟,但同时也暴露出许多急需要解决的问题,其中,对PPP项目进行科学、合理的价值评估是难点问题。BOT模式是PPP模式之一,本文对BOT项
我国民众对网络言论失范行为问题的关注热度与日俱增,因为网络已经成为人们日常生活不可缺少的一部分,网络言论的发展方向不仅关系着个人的生活和学习,也影响着社会的稳定和国家的长治久安。而要妥善解决好网络言论失范行为,需要处理好网络社会中自由和秩序两者之间的关系。马克思主义是针对人类解放问题的科学理论,自由是其中重要的领域。唯物和辩证地分析网络言论自由和秩序的关系,不仅可以为解决网络言论失范的现实问题提供
面对日益增长的垃圾产量和环境状况恶化的局面,生活垃圾分类越来越受到世界各国的关注,培养人们的垃圾分类意识,传播垃圾分类知识成为各国政府的重要工作任务。近年来游戏产
高分辨率图像拥有丰富的细节信息,可以在视频监控、医疗图像、卫星遥感等图像处理和计算机视觉任务上提供很大的帮助。然而,由于成像硬件设备的限制,很多场合下只能得到低分辨率的图像,高分辨率的图像资源比较缺乏。因此,为了摆脱硬件条件的限制,使用图像超分辨率重建技术来获得高分辨率图像是一种很好的选择。目前在超分辨率重建领域中,基于学习的算法取得了较好的重建效果,然而这些算法大多需要较长的时间来训练模型,导致
那些希望在全球范围或在新的市场上运作的电子商务公司通常要经常检视其商业模式以更好地应对竞争或适应新的经营环境。要做到这一点,这些公司需要在国际化或本土化的商业模式之间做出选择。本研究正是在全球竞争的背景下,探讨Jumia Market这一电子商务公司如何改进商业模式本土化策略,以更好地在喀麦隆经营。具体而言,本研究是以Jumia Market为研究对象,对其商业模式本土化策略进行定性的案例研究。本
上海的老龄化程度不断加深,根据2017年上海市统计局数据显示,上海市的老龄化率达到14.3%。与此同时,空巢老人所占的比例不断提高,这一类群体是一个不容忽视的社会问题。由于老年人生活在“空巢”环境下,老人的社交网络较为狭窄。因此相比同龄老人,空巢老人的心理问题较为突出,常会出现低落的情绪和消极的生活态度。若老人长期处于这样低落的情绪状态,会造成生理上的损伤。因此空巢老人的心理情绪问题亟待解决,通过
随着通信技术的蓬勃发展,基于位置的服务在人们生活、工作中扮演着重要作用,使得定位技术尤其是室内定位受到越来越多的重视。无线局域网(Wireless Local Area Network,WLAN)