动态场景下的目标人物重现特效研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiaoshumin82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人像摄影是一种热门的拍摄题材,然而在很多场景下,诸多不可控因素,如背景人物众多、背景繁杂等,都会导致成片效果不尽如人意。此外,静态的图像不能像视频或动图一样表达丰富的信息,如果能使目标人物在同一张照片中反复出现,就可以通过让目标人物摆出不同的姿势来表达丰富的信息。现有的方法大多通过Photo Shop等图像后期处理软件,人为判定背景人物并进行图像复制粘贴等处理达到上述特效效果。这种方法不仅操作费时费力并且可能选择到错误的目标人物,还有可能造成图像信息缺失。本文基于实例分割算法,设计了一种动态场景下的目标人物重现特效生成框架,在去除背景人物的同时使结果图中目标人物多次出现在图中不同的位置,以传递更多的语义信息并使图像背景干净。本文利用现有的实例分割算法框架对图片中的人物进行检测与识别,并对实例分割算法进行了深入的研究和改进,以解决检测不到远处的背景人物问题。主要工作内容如下:1.设计了一个人物重现特效框架,该框架主要包含四部分:人物检测、人物统计与识别、实例分割与图像区域复制粘贴。2.设计了一个基于卷积神经网络的人物特征提取、比较和统计方法。由于动态场景下行人不断变化但目标人物始终在图像中,本文通过统计每个人物在所有输入图像中出现的次数,判定其是否为需要保留的目标人物。3.对于目标人物与背景人物独立没有重叠部分时,直接采用实例分割算法对人物进行分割,利用分割得到的掩膜实现人物重现特效。针对目标人物与背景人物有重叠部分的情况,本文设计了人物粗分割、三区域标注图生成方法和图像去背景方案,得到精细化的人物掩膜进行后续处理。4.深入研究并分析了现有实例分割模型对小目标的漏检情况与原因,并针对这一问题对特征提取骨干网络结构进行了优化。本文在特征提取网络的不同阶段加入了不同扩张率的空洞卷积。空洞卷积使得网络不承担额外运算量的同时,深层的特征图也可以保持较大的尺寸,从而有利于检测小目标。5.在特征金字塔网络中,深层特征图需要先扩大到与低层特征图相同分辨率再进行逐元素相加融合,导致低层特征融合路径过长。本文在特征金字塔网络后面连接了一个自下向上特征融合的路径,在该路径中,低层特征经过卷积层,与高层特征统一分辨率和通道数,然后与高层特征进行融合。减少了低层特征需要通过的卷积层数,使小目标的特征容易保留。本文在高层特征与低层特征横向连接时,增加了恒等映射,使得网络无需负担更多计算量的同时,能够保留更多低层特征,有效地提高了网络对小目标的检测性能。除此之外,由于上采样过程中采用的最近邻插值法会导致混叠效应的出现。本文采用了最近邻插值法与卷积操作结合的方法,有效的避免了混叠效应带来的特征混乱等负面影响。
其他文献
随着航空航天,交通运输和国防、军事工业的发展,业界对铝合金的强度、塑性和尺寸稳定性提出了更高的要求。传统铝合金存在强度低、尺寸稳定性差、不耐高温等缺陷,因此急需开发强度高、塑性好、尺寸稳定性高的新型铝合金材料。纳米金刚石(nanodiamond,ND)既具有金刚石高硬度、高强度和低热膨胀系数的优势,同时又具有纳米材料尺寸小,比表面积大,表面能高和表面易修饰等优良特性,是一种颇具应用前景的铝基复合材
学位
毫米波频段通信是5G技术的重要组成部分之一,提供更快的上下行速度,更宽的带宽,更低的延迟以及更少的干扰,是未来无线通信的重点发展方向。相控阵天线因波束的灵活跳变被广泛应用于卫星通信、蜂窝移动通信、目标跟踪系统等方面,宽角扫描毫米波相控阵天线是5G、6G通信系统的研究热点。然而目前的相控阵天线大多只能在±45°范围内扫描,并且时常伴随着4-5d B的增益波动,本文针对相控阵天线的波束扫描能力以及增益
学位
目前学界为数不多的将经典叙事学运用于翻译批评的研究,多聚焦于叙事视角、话语呈现方式、讲述与展示、叙事时间、不可靠叙述、叙事距离6个元素,而且留有很多深入研究的空间。这在理论和实践上都难以满足译本全面的叙事翻译批评需求。本文又提出叙事空间、隐含作者、元叙事、易读性与可读性、叙事结构、叙事功能6个元素。通过运用跨学科移植法和“规定+描写辩证批评法”,我们建立一个包括上述12个元素以及相应详细考察要点的
期刊
报纸
5G通信产业本身对于频率源的准确度和稳定度的要求很高,使用中国北斗卫星导航系统(Bei Dou Navigation Satellite System,BDS)信号驯服恒温晶体振荡器(Oven Controlled Crystal Oscillator,OCXO)改善恒温晶振输出频率的老化漂移和稳定漂移的技术是解决部署问题的关键。如何提升恒温晶振在失去锁定后的保持能力成为至关重要的问题。本文研究提
学位
随着电子数据采集设备的普及,每天都有大量的信号序列数据通过网络传输的方式,源源不断的输送到数据终端。这些采集到的序列数据里,相邻事件之间可能存在某些必然的联系,揭示设备中事件的发生规律。近年来,计算设备数据处理能力的提升,使得人们从海量序列数据中,挖掘出频繁出现的序列情节片段成为可能。如何对序列信号数据进行高效的频繁情节挖掘,发现序列信号中潜在的规律信息,引起学术界的持续关注。与序列模式挖掘不同,
学位
深度卷积神经网络模型已经成为图像分类应用的基石,在生物认证、智慧医疗、自动驾驶等场景中发挥重要作用。近年来,对抗样本揭示了卷积分类模型的脆弱性,向模型的安全性提出了严峻挑战。攻击者通过在原图像素上添加扰动生成对抗样本,令模型错误地判断图像类别,但对于人类视觉系统而言,对抗样本和原图的类别一致。然而,由于神经网络工作机理的高复杂性和不透明性,至今无法提出一步到位的方法使模型产生免疫。因此,以增强模型
学位
在行人检测领域,基于卷积神经网络的深度学习技术已经取得了比传统方法更好的检测性能。但随着深度卷积神经网络的迅速发展,检测模型的网络结构也愈加复杂,参数量和计算量快速增加。在计算资源有限的硬件设备部署行人检测模型时,如何在保证检测精度的条件下满足检测实时性的要求就成为亟需解决的问题。本文围绕基于锚框的单阶段行人检测方法展开研究,针对在计算资源有限的硬件设备实现行人检测任务所面临的实际问题,结合轻量化
学位
在深化安全建设、完善社会治安立体化防控体系的要求下,监控系统作为一种网格化管理的有效安防方案,正朝着全方位、超高清的方向发展。而随着监控相机布控数量不断增加,传统的多屏切换播放方法逐渐暴露出内容离散、相关性弱等缺点。这为用户添加了对时空信息的认知负担,并且无法满足智能监控多维度、立体式的可视化需求。本文针对如何实现多路监控视频的有效整合与直观可视化这一亟待解决的问题展开了研究,结合增强虚拟现实技术
学位
随着科技的飞速发展,光谱成像技术日益精进,针对于高光谱图像的解译处理已成为遥感领域的研究热点之一。相较于其他传统成像方式,高光谱图像具有信息量大、光谱波段范围广、谱段分辨率高等特性。因此,其现已被广泛应用在地质监测、农业生产、环境评估以及军事侦察等多个领域。对于高光谱图像而言,可看作是由相同场景组成的三维立方体,其中每个维度的成像场景都与特定光谱波长相关。大量的光谱信息简化了地物类别之间的判别差异
学位