基于多目标跟踪的视频实例分割研究及应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:cuitlcm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能移动终端数量的井喷式增长,全民参与拍摄或观看短视频已成为生活的常态;同时影视剧行业也正经历更深层次的变革,呈现出题材更加多元化以及内容更细分化的趋势。无论是搞笑幽默、体育竞技、影视剧还是教育类的视频内容都得到了爆发性的增长,各式各样的视频制作平台快速兴起和迭代。由于各类视频在实际应用时进行人工编辑过于耗时耗力,需要在没有任何用户给定信息的情况下对视频进行自动化分割,来实现人力的解放和视频处理效率的提高。考虑到人是这些视频中最重要的内容,需要针对视频进行包括人体本身、人体的附属物和手持物的整体分割。因此研究视频人物整体自动化分割技术对视频制作的平台和用户都有十分重要的意义。本文基于多目标跟踪算法,对视频中的人物整体进行无监督视频实例分割算法的研究和应用分析。主要完成以下工作:1.设计了一个基于多目标跟踪的无监督端到端视频实例分割网络,共由两个模块组成:a)设计分割模块。利用一个anchor-free的目标检测网络对骨干网络生成的特征图进行中心点位置、中心点偏移量、检测框大小的预测。通过将这三个预测结果结合起来,得到目标实例的候选框,然后设置置信度得分阈值进行筛选。进而在骨干网络生成的特征图上,利用Ro IAlign方法裁剪得到候选框对应区域的特征图。这些裁剪的特征图在经过五层卷积层后,每个像素将进一步被分为“人物整体”或背景两类,从而生成每个目标人物的掩码。b)修改跟踪模块。将跟踪目标的候选框和对应的预测掩码进行匹配和保存,然后进一步得到对中心点处re-ID特征相似性、卡尔曼滤波、Io U阈值等条件进行限制的匈牙利匹配结果,并对跟踪轨迹做相应的处理。对于视频序列中的同一对象,统一其在每一帧的掩码颜色。最终我们的网络实现了对视频人物整体的自动分割。2.针对我们提出的网络所存在的问题,做出以下三点改进:a)引入非极大值抑制的替代方法Confluence。我们提出的网络存在对同一人物预测出多个中心点,进而生成多个候选框,最终导致出现单个人物的掩码具有多重颜色的问题。针对这一问题,我们通过Confluence算法选出最佳候选框,得到了有效的解决。b)引入外部注意力机制。通过这种轻量级注意机制,利用两个外部记忆单元,对自身样本内的信息和不同样本间潜在的联系进行学习,在一定程度上提高了分割掩码的精度。c)引入混合剪贴的数据增强方法。利用混合剪贴数据增强方法,在原有数据集的基础上构建了更为丰富的训练数据,缓解了稀有形态人物的数据量不足导致的分割不精确问题。
其他文献
随着工业化的快速发展和全球人口的增加,水体中抗生素污染已经成为一个日益紧迫的问题。因此,研究水环境中抗生素的清除技术具有重要意义。目前,已有研究证实粘土矿物对水体中的孔雀石绿染料废水具有光催化降解活性。但粘土矿物用于光催化降解方面,还存在活性低、研究机理不深入的问题。红粘土(Red Clay,R-Clay)作为一种天然粘土矿物,因来源于大自然、充足、绿色和廉价易得的特性备受青睐。以往对R-Clay
学位
深度图像作为连接二维视觉与三维视觉的桥梁,在计算机视觉领域具有重要而基础的地位。但由于成像原理与传感器质量的限制,常见的深度图像会因环境光照、纹理、以及观测物表面材质等原因造成孔洞、畸变、噪声、分辨率低等问题与瑕疵。为了有效处理这些问题,许多专家学者提出了自己的解决方案。基于不同原理的深度图像增强方案可以部分滤除深度图像中常见的高斯噪声,或可以填充不同成因的结构性孔洞,但也遗留了一些难以解决的固有
学位
毕业设计是对学生所掌握的专业知识的全面检查,是对学生知识学习、运用能力和实际科研工作能力的一种综合锻炼,是训练学生独立思考和科学工作的重要实践教学环节,是在升学和就业的大背景下对大学生的理论与实践转化能力的一次考验。文章通过分析工科本科毕业设计教学存在的问题,并结合同类院校的实践经验,对毕业设计培养过程提出了几点改革意见,以期在科学的培养方案、综合的锻炼、针对性的理论指导和技术支持下,使毕业学生能
期刊
高校教学质量评估活动开展为广大教师及时调整教学策略提供针对性建议,有助于提高教学质量。但现行评估方法多为简单加权平均,人为给定指标权重,常存在主观性和片面性局限。针对上述现象,该文综合学生、同行教师、督导员三方评价将教学质量分为优秀、良好、一般和较差4个等级,并采用神经网络算法,建立基于卷积神经网络的教学质量评估模型。该文首先研究现行教学质量评估体系优缺点,判断模型构建可行性,提出基于深度学习的教
期刊
社交媒体作为广大网民表达自我、沟通分享的主要平台,在信息传输、资源共享、即时互动和娱乐消遣等多维度便捷了人们的日常生活,成为大家使用互联网的重要内容。但社交媒体强烈的社交属性也成为了网络暴力的助燃剂。近期,我国开始大力整治网络空间,设立网络安全周、出台《网络信息内容生态治理规定》、开展“清朗”专项行动等,但网络暴力仍冲击着健康的网络生态环境和社会主流价值观,防治网络暴力的路道阻且艰。大学生群体作为
学位
地下工程开挖导致的岩爆具有明显的滞后效应,研究显示,滞后型岩爆的发生与岩石的时滞性破坏密切相关,基于此,考虑开挖后围岩自身所处的实际应力状态,选取工程建设中典型的砂岩为研究对象,在理论分析的基础上,开展静动荷载作用下的单轴压缩及三轴卸荷时滞性破坏试验,并通过PFC3D颗粒流程序对静动荷载作用下砂岩时滞性破坏开展数值模拟分析,综合分析砂岩的时滞性变形破坏特征和破坏机理。主要得到以下相关结论及成果:⑴
学位
有限时间稳定性涉及系统在有限时间范围内的性能,其理论在模拟飞机系统、电力工业和金融系统等广泛应用中发挥着重要作用.本文利用新的指数函数加权不等式以及Lyapunov-Krasovskii泛函方法研究了线性时滞系统有限时间稳定性问题.并通过数值仿真,验证了所得结果的有效性与可行性.全文分为4章,主要内容如下:第一章为绪论部分.首先,介绍了本文的研究背景.其次,分析了积分不等式在时滞系统稳定性中的发展
学位
“双碳”目标下,新能源微电网有望得到更大规模发展,将形成含有多个微电网的主动配电网(ADN)系统,需要协调微电网内部、微电网之间以及ADN与多微电网之间的资源调度,促进新能源就地消纳,提升系统整体效益。为此,针对多微电网的分布式储能和共享储能两种典型应用场景,本文提出了相应的多微电网和配电网之间的协调优化调度策略。论文的主要工作和解决的关键问题如下:(1)含分布式储能的多微电网和配电网之间的协调优
学位
目的 探讨老年股骨粗隆间骨折髓内钉内固定术后慢性感染的治疗方法及临床体会。方法 回顾性分析自2014-01—2019-02诊治的11例老年股骨粗隆间骨折髓内钉内固定术后慢性感染,均为慢性深层感染,未累及髋关节。一期手术取出内固定,清除感染病灶,置入抗生素骨水泥链珠,术后应用敏感抗生素,实验室指标连续3次(间隔1周)在正常范围后二期手术取出抗生素骨水泥链珠。结果 一期手术后所有患者白细胞计数、降钙素
期刊
为充分发挥教学质量评价在高校中的作用,研究基于关联规则的建筑学专业教学质量评价方法。首先,构建建筑学专业教学质量评价指标体系;其次,基于关联规则挖掘算法,从众多数据中发现数据之间的关联;最后,通过D-S理论确定指标权重,在众多结果中准确获得最终评价结果。实例分析发现:基于关联规则所建立的教学质量评价模型,模拟软件评分与使用本文方法测试的结果相差在0.001~0.009;使用文中方法进行教学质量评价
期刊