面向遮挡场景的人体实例分割研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:aa377059590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展以及机器算力的提升,计算机视觉的研究向着更精细、更准确的方向前进。传统的分割算法只能将图像中的一类整体分割出来,深度学习时代的分割算法则可以对图像中的关注目标进行实例级的分割,甚至进行精准的部件级分割。尽管实例分割算法已经在自然场景中达到了较高精度,但在遮挡情况发生时,现有算法往往无法满足需求,这在对于人体类别的实例分割算法中尤为明显。因而,本文专注于对遮挡场景中的实例分割算法进行研究,针对人体这一特殊类别,通过构建遮挡场景人体实例分割数据集、优化实例分割算法架构等方式,面向遮挡场景的人体实例分割与非模式实例分割任务进行研究。本文首先构建了面向遮挡场景的人体实例分割数据集。针对通用实例分割数据集无法反应遮挡场景人体实例分割效果的问题,本文在百度人像分割数据集的基础上,通过人为构建遮挡的方式,合成了大型遮挡场景人体实例分割训练集OHIS-train与验证集OHIS-val。此外,本文在公开数据集OCHuman基础上,人工筛选构建了遮挡场景人体实例分割测试集OHIS-test。其次,本文提出了融合自下而上特征的单阶段实例分割算法EM-BUF。针对遮挡场景的实例分割任务,本文对比了现有实例分割算法在多个遮挡场景实例分割数据集上的表现,并选择单阶段实例分割算法Embed Mask作为本文基线模型。此外,本文通过增大像素编码特征图分辨率及融合自下而上特征的方式,提升了算法在实例分割任务上的性能。在公开数据集COCO上的实验结果表明,本文所提EM-BUF相较于基线模型能够提升1.1%的平均精度,在OHIS-test上的结果显示EM-BUF获得了最高的平均精度。再次,本文提出了基于非局部注意力的非模式实例分割算法EM-NLA。针对非模式实例分割任务中对于更大视野域的需求,本文在Embed Mask的基础上,融合非局部注意力机制,并增加非模式像素特征编码模块,提出非模式实例分割算法EM-NLA。在非模式实例分割数据集KINS-test上的结果表明,EM-NLA在平均精度上较基线模型提升2%。在OHIS-val上的实验结果表明,EM-NLA在遮挡场景人体非模式实例分割任务中取得了最优性能。
其他文献
我国城市化进程背景下人口向大中城市集聚趋势明显,城市空间扩张导致了职住分离现象,居民通勤距离拉长从而产生更多机动化出行需求。而小汽车出行方式的增多加重了城市交通系统负担,还造成了空气污染、能源消耗等各种负面效应,制约城市交通的可持续发展。在城市建设过程中,规划者开始考虑能否通过改善建成环境来促进居民出行方式调整,减少小汽车的使用。本文以环境行为学和效用最大化为理论基础,先是对建成环境概念进行了解释
学位
国内电商高速发展,淘宝、京东、拼多多等平台已逐渐取代了实体店铺,尤其随着新冠疫情的爆发,线上平台已成为人们购物的不二选择。随着购物需求的日益增多,如何将商品自动准确分类从而进一步精准推荐已成电商平台亟待解决的问题。服装相较于其他商品更具多样性,背景复杂、姿态各异、形变、视角、遮挡等因素都影响着其定位和分类的准确性,使服装分类任务成为一件具有挑战的任务。本文针对服装类别和服装风格分类问题展开研究,基
学位
随着我国高铁经济的快速发展,北京城区内高铁数量逐渐增多。京沪高铁对城市空间的割裂,导致沿线环境无序,地面空间闲置等问题突出。在城市交通空间的高质量发展下,城区内高铁沿线空间的再利用是治理的重要对象。北京行政辖区内京沪高铁共约41.88km,以高架形式为主,其桥下及沿线地面空间的再利用是本论文的研究内容。研究首先对城区内的京沪高铁沿线城市空间现状进行梳理,在遥感卫星图像的基础上,结合研究区内的实地调
学位
近年来,由于市场激烈竞争,企业采取并购方式进行规模扩张来扩大市场占有率越来越广泛。截至2021年12月,我国企业并购交易量达12790笔。然而实际并购中存在信息壁垒、对目标企业实际经营状况偏差等因素,引发收购目标企业估值不准确。于是对赌协议就应时而生运用于企业收购中,其事先约定相关条款和目标,便于控制因信息不对称和估值方法错误等因素产生的估值偏差风险、激励被并企业实现业绩目标、降低整合失败风险。但
学位
耕地作为粮食作物生长的载体,是保障粮食安全的基本要素。我国人多地少,人均耕地资源远低于世界平均水平,近年来由于城市化的加快以及社会经济的发展进一步导致了耕地数量的减少,粮食安全受到威胁,因此国家制定了严格的耕地保护制度对耕地的数量和质量进行保护。其中高标准农田建设可以巩固和提高粮食生产能力、保障国家粮食安全,高标准农田建设区的划定是高标准农田建设的首要工作,因此确定影响高标准农田建设条件的评价因子
学位
关系抽取是自然语言处理的基础任务,远程监督方法可以为关系抽取任务自动构建数据集,缓解人工构建数据集的压力和成本,为自动关系抽取的实现建立基础。然而其强假设的数据集构建方式造成错误标注的问题,引入大量噪声数据,导致较差的模型性能。因此为缓解远程监督中噪声数据问题,一方面从现有知识库引入实体背景描述信息来为模型提供更丰富的输入句子特征。另一方面采用对抗训练提高模型在遇到对抗样本时的鲁棒性。本文针对远程
学位
去芳构化反应是有机合成中的基本反应之一,它能够将芳香化合物转化为非芳香环状化合物。Birch还原反应是最常见的去芳构化反应之一,但是其往往需要使用碱金属和液氨等,而这些苛刻的反应条件限制了它的广泛使用。一个有意义的改进是,用氯硅烷作为亲电试剂,在普通溶剂中将芳环转化为硅取代环己烯或衍生物。该类反应所用试剂廉价且反应条件安全温和,但其适用范围仅限于结构简单的富电子芳烃。对于缺电子的芳基羰基化合物,在
学位
在新媒体迅猛发展的时代背景下,党媒也开启了平台化生产和传播模式,陆续入驻各大社交媒体平台以及其他新媒体平台。而在复杂的舆论环境下要想实现长足发展,必须在了解新媒体的平台属性以及受众需求的前提下积极争夺话语主导权,提升传播力和影响力。而运用情感传播策略能有效地增进受众的情感认同,从而达到有力的传播效果以助党媒“重夺麦克风”,基于此,党媒在新媒体平台开始摸索传播实践中的情感应用。本文选取《人民日报》微
学位
深度学习有着强大而有效的网络结构,可以高效地解决传统机器学习无法解决的复杂学习问题。得益于优秀的学习能力,深度神经网络广泛地应用于目标检测、图像分类、语音识别等领域,其中卷积神经网络在图像分类任务上的表现甚至超越了人类水平。然而近期的研究发现网络对于微小扰动有着很强的脆弱性,比如图像任务中的对抗样本,是一种人为构造的特征扰动,微小到人类几乎无法察觉,但会极大地干扰网络的正常决策与行为。除了精心构造
学位
聚类是一种重要的无监督学习技术,其目的是将无标签数据分成几类或几组,广泛应用于计算机视觉、数据挖掘等领域。传统聚类算法对低维数据能够取得较好的效果,但对图像等高维、复杂、大规模数据集,传统方法存在计算成本高、易受冗余数据影响等问题,很难取得较好的效果。基于自编码网络(Auto Encoder,AE)的降维方法是目前用于聚类的主流方法,它通过构造结构良好的AE并与适当的聚类损失函数相结合,使得提取出
学位