【摘 要】
:
实例分割是计算机视觉领域的一项新兴的综合型任务,这一综合性任务同时涉及了图像分类、物体检测和语义分割三个子任务。实例分割是自动驾驶、三维重建等工作的底层任务,在工业界有很好的应用前景,受到众多学者和工业界人士的关注。近年来,伴随着深度学习的发展,实例分割从无到有,逐渐发展分化为两步式方法与一步式方法。当前实例分割普遍存在分割掩膜不精细、定位检测框无法包含完整物体等问题。本文针对上述的两个关键问题,
论文部分内容阅读
实例分割是计算机视觉领域的一项新兴的综合型任务,这一综合性任务同时涉及了图像分类、物体检测和语义分割三个子任务。实例分割是自动驾驶、三维重建等工作的底层任务,在工业界有很好的应用前景,受到众多学者和工业界人士的关注。近年来,伴随着深度学习的发展,实例分割从无到有,逐渐发展分化为两步式方法与一步式方法。当前实例分割普遍存在分割掩膜不精细、定位检测框无法包含完整物体等问题。本文针对上述的两个关键问题,基于经典的两步式实例分割算法,从多尺度特征融合、非极大值抑制算法着手研究。本文的主要工作如下:(1)提出一种基于多尺度特征融合的实例分割算法(Mask-Refined R-CNN),解决物体细节错误分类,分割掩膜不精细的问题。传统的两步式实例分割算法在分割头部网络采用了尺度不变的全卷积网络,忽略了不同尺度感受野之间空间信息的差异。网络无法考虑对象边缘像素之间的关系,这些像素将被错误分类。本文在实例分割框架Mask R-CNN的基础上,将原有的全卷积语义分割头部网络替换为可以融合高层和低层信息的特征金字塔结构,并对应调整了ROIAlign的输出大小,最后在特征金字塔上增加横向连接来平衡前向和后向传递的信息量,最终返回与输入图像相同分辨率大小的图像。Mask-Refined R-CNN能有效地提高分割精度,在对较大尺度实例进行预测时表现很好。(2)提出一种面向实例分割的合并非极大值抑制算法(Syncretic-NMS),解决物体检测边界框无法完整包含实例的问题。物体检测的评估标准要求边界框与真实值尽量接近,但是不强调包含物体的完整性,因此边界框通常不能完整包含物体,位于边界框外的部分无法在后续的语义分割中得到正确的预测结果。针对此问题,本文提出了合并非极大值抑制算法。算法在获取传统非极大值抑制算法返回的边界框后,对每一个边界框的相邻边界框进行关联判断,将相关性强的邻框与对应边界框合并,合并框的坐标为边界框和强相关邻框的坐标极值。通过分析关联要素的影响,给出了关联判断的准则。Syncretic-NMS的计算复杂度与传统NMS相同,易于实施,不需要额外的训练,可以简单地集成到现有的实例分割框架中。(3)将提出的基于多尺度特征融合的实例分割算法和合并非极大值抑制算法在MS COCO数据集和Cityscapes数据集上进行验证,并与当前主流实例分割算法进行对比。实验表明,Mask-Refined R-CNN能有效提高分割掩膜精细度,尤其对于图像中的较大物体,掩膜质量会显著提高。Syncretic-NMS能稳定地提高实例分割精度,且算法能较好地适应场景变化。(4)将本文的两种算法融合到一个实例分割框架下进行验证,并与当前主流实例分割算法进行对比。实验表明,基于多尺度特征融合与合并非极大值抑制的实例分割取得了最高的分割精度,不仅能较为完整地包含实例,还能精确地对边界框中的实例进行分割。
其他文献
白酒糟是粮谷物和糠壳等混合物经过发酵、蒸馏制得白酒后的副产物,并富含纤维素、蛋白质等有机物。目前白酒糟主要用于生产动物饲料,然而中国每年能产生几千万吨乃至上亿万吨的白酒糟,这给白酒糟的资源化利用带来了巨大挑战。缺乏高效又廉价的处理方法制约了白酒糟的综合利用,也导致了白酒糟被随意丢弃,进一步造成了资源浪费和环境污染。开发白酒糟处理方式,提高经济和环境效益是白酒行业的一个重要课题。由于白酒糟中的纤维素
阿尔茨海默症(Alzheimer’s Disease,AD)是神经退行性疾病中最为常见的一种,在发病率、患病率和致残率上具有较高的比例,给人类健康生活带来了严重的威胁。AD的主要临床表现为认知功能损伤,生活自理能力丧失,且伴有不同程度的神经精神症状及行为障碍。AD致病机制尚不清楚,目前主要有Aβ学说、Tau蛋白代谢异常学说等几种假说。AD治疗方法主要包括药物与非药物疗法。当前的药物疗法可以缓解AD
近年来,自然语言处理领域发展迅速,深度神经网络得到了广泛的应用。同时,在互联网、人工智能等技术蓬勃发展的大背景下,各大手机音乐软件为了实现功能多样性和丰富用户的体验,歌曲的智能搜索和推荐功能逐渐兴起并普及,对于歌词的情感分析是实现这些功能的关键技术。在一首歌曲中,旋律与歌词相辅相成,它们共同传达着歌曲所表现的情感与内涵。其中,歌词不仅包含着语义信息,还可以作为音频信号的旋律、结构和节奏特性的载体,
在半导体材料,天体物理,理论物理等领域,许多问题都可以归结为非线性退化方程问题。对具有应用背景的退化的非线性偏微分方程是当今研究的焦点和热点。本文主要研究了一类非线性退化椭圆和抛物方程解的存在性与正则性,全文安排如下:第一章主要介绍关于这类非线性退化方程的背景和研究现状,简要介绍本文的主要工作。第二章简要给出本文所涉及的一些基本空间和重要不等式。第三章主要研究下列具有低阶项的非线性退化椭圆方程:此
医疗信息物理融合系统(Medical Cyber-Physical Systems,MCPS)是以保障生命安全为重要前提的网络化、智能化的医疗系统。MCPS中的医疗数据由采集得到的患者的身体参数数据和患者的医疗就诊记录数据组成,是一个典型的大数据系统,传统的MCPS数据库采用集中式的数据存储结构,将全部数据存储于一个中心数据库中,一旦中心数据库遭到入侵,所有数据将面临严重的威胁,而区块链(Bloc
近年来,推荐系统广泛应用于众多商业网站,不仅方便了用户对信息的检索,提升了用户的体验,还为企业创造了巨额的利润。在众多推荐算法中,协同过滤是当前最为主流的算法。尽管协同过滤算法在推荐系统中效果较好,但是仍存在着数据稀疏、算法可扩展性差以及冷启动等问题。因此,本文将研究推荐系统中的协同过滤算法,并针对该算法存在的问题提出一些解决方案。具体工作如下:(1)提出一种基于偏好模型和类别属性的协同过滤算法P
随着计算机和传感器技术的快速发展,机器人的种类也从一开始一些完成简单任务的工业机器人,延伸到农业、医疗、教育、航空航天等领域。机器人技术蓬勃发展的同时,如何实现机器人的精准实时定位和导航也成为机器人研发的热点问题之一。同步定位与地图构建(SLAM)方法在解决机器人定位难、精度差和传感器要求高等问题上有特殊意义。本文在传感器的选择、传感器的融合技术、地图构建和导航算法做出对比分析,提高机器人定位导航