使用生成对抗网络的行人姿态转换方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zk0529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别(Person Re-identification,Reid)是当今摄像机网络的普及衍生出来的行人监测的任务之一,随着深度学习的快速发展,行人再识别技术也演变为计算机视觉领域的重要挑战。在摄像机网络的应用中,失踪人员的搜索,犯罪人员的追捕,嫌疑人员的调查都有着重要的实际意义,然而摄像机网络获取的行人图像与视频,普遍面临着行人像素较低,因而广泛应用于人员识别的人脸识别手段并不适用,由此便产生了基于低分辨率行人图像或视频进行的行人再识别任务。目前基于深度学习的行人再识别算法已经在一些行人数据集上得到了很好的成果,相比传统方法而言取得了很大的提高,然而在现实中面临更复杂情景下的行人时,现有行人再识别技术仍然面临着许多问题。首先,现有行人数据集的规模仍然不够,行人样本数量不足以达到更好的行人再识别效果;其次,行人样本间存在着多种姿态,同一身份行人姿态的不对齐导致深度神经网络难以从其中提取统一的特征信息以保证正确的分类结果。因此近年来,生成对抗网络(Generative Adversarial Network,GAN)被用于行人样本的预处理工作,通过行人姿态转换进行扩充数据集以及行人姿态归一化等方法,逐一解决行人再识别面临的以上问题。使用生成对抗网络生成特定的行人样本,是行人再识别技术的辅助工作之一。首先通过行人姿势关键点预测与行人姿势估计手段获取行人的姿势信息,继而基于生成对抗网络,使用行人样本与行人姿态生成同一身份非同一姿态的虚假行人样本,达到扩充行人姿态或者行人姿态对齐的目的。但是行人样本生成任务同样面临着亟待解决的问题。首先,行人数据集中的行人样本除了行人部份外,还有着复杂的背景信息,这一部分信息可能会干扰行人的生成结果;其次,现有行人姿势估计手段获取的行人姿态存在着一定的错误率,这会严重影响生成和对抗网络训练效果的可靠性。本文通过使用基于语义分割技术的行人分割方法,获取行人数据集的分割掩模,利用行人样本分割掩模分别实现了获取行人姿态方法的优化以及行人姿态转换样本生成的优化。本文首先通过使用行人分割技术,获取行人数据集中行人图像的二值化分割掩模。利用行人分割掩模获取无背景行人图像后,采取了使用生成对抗网络进行无背景行人图像的姿态转换工作。其后为解决行人姿势估计方法获取的行人姿势掩模错误问题,提出了使用行人分割掩模引导的行人姿势掩模修正方法。通过利用行人分割掩模蕴含的行人轮廓信息以及隐含的行人姿势信息来修正错误的行人姿势掩模,并使用生成对抗网络获取两者间的映射关系,达到使用任意正确的行人姿势掩模,可以根据输入的行人分割掩模生成更准确的行人姿势掩模的效果,继而使用生成图像取代原有的错误行人姿势掩模。而针对使用行人姿势掩模引导的行人姿态转换方法生成的行人图像体态不准确的问题,本文提出了使用行人分割掩模引导的行人姿态转换方案,利用此方法可以生成准确的行人轮廓,并且无背景的生成样本,其生成结果可以利用背景掩模将背景还原,达到保留更多有效信息的效果。最后,落实到行人再识别技术的优化,本文采取了将生成对抗网络与预训练的行人再识别网络进行串联,将生成的假样本传入再识别模块,获取再识别损失(Reid_loss),引导生成器进行优化,以生成更有利于行人再识别网络的行人样本。在这些工作的基础上,本文使用改进后的行人姿态转换方法,通过扩充数据集以及姿态归一化两种手段,对行人再识别工作结果进行优化。总的来说,本文为使用生成对抗网络的行人姿态转换方法提出新的思路,并通过大量实验证实文中方法的合理性与可靠性。
其他文献
国内的各大油田其中大部分都已进入开采的中后期,通过使用注水井向油层注水来补充能量,以保持油层压力,成为了提高油井采收率和采油速度而被广泛采用的一项非常重要的开发措
随着我国经济体制改革的不断深化,增值税在实际运行过程中,一些深层次的矛盾开始暴露出来,比如税率过多引起的操作复杂,税制复杂导致的征管繁琐,出口退税率偏高引起的骗税动机强,增值税发票虚抵造成税收流失等。最明显的问题表现为增值税征收程序复杂,使得企业之间的税额环环相扣,导致有些企业疲于应付。将区块链技术应用于增值税的税收征管中就可以实现交易流程信息化,各个环节中的增值税自动抵扣,使整个增值税征收环节便
[目的]脑缺血再灌注损伤(Cerebral ischemia-reperfusion injury,IRI)是多种神经系统疾病中共同的病理过程,在损伤区域的细胞经受氧糖剥夺与再复氧(Oxygen glucose deprivation and reoxygenation OGD/R)。环状RNA(Circular RNA,circRNA)作为非编码RNA中的一类已被证实在神经系统疾病中发挥重要的作
随着声学材料在低频段的应用越来越广泛,相应的研究也因此越来越受到重视,其中声反射系数是表征声学材料低频性能的重要特性之一。目前对于声学材料大样低频性能的研究,大多
凿岩机器人能有效提高钻孔效率,提高隧道开挖速度,减少人工劳动强度,机械化水平高,能有效节省开挖成本,其智能化的发展,可实现无人化作业,将人从繁重的工作中解脱出来,具有重大战略意义和广阔的应用前景。因此,本文以某款凿岩机器人为研究对象,对其智能化运动算法与误差补偿进行了研究,主要工作内容如下:首先,对选定的凿岩机器人机械臂进行结构分析。采用D-H法和反变换法进行机械臂的正逆运动学求解,因其机械臂存在
有机太阳能电池凭借其轻质,便携,柔性以及便于卷对卷大面积生产等优势,被认为是新一代光伏器件的杰出代表之一。高的能量转化效率以及优异的稳定性是有机太阳能电池走向产业
冷弯薄壁钢结构体系源于传统的木结构房屋,是一种由组合墙体、组合楼盖、组合屋面及基础组成的新型结构体系,具有抗震性能好、绿色环保和施工速度快等显著优势,有利于我国建
极化合成孔径雷达(polarimetric synthetic aperture radar,PolSAR),提供了不同极化方式下地物的后向散射信息,拓宽了雷达成像的维度。相干斑抑制研究是PolSAR数据处理中的重要课题,对后续目标识别,影像分类等应用有重要的意义。随着PolSAR系统分辨率的不断提高和应用的深入,对PolSAR影像上复杂纹理和细节丰富的区域,如城区等异质性区域的处理越来越引起大家
近年来,随着我国改革开放的逐步深入造成的社会关系复杂化及计划生育政策所导致的家庭结构小型化等原因,实践中常出现无诉讼行为能力人的法定代理人侵害被代理人利益、与被代理人利益相冲突,或法定代理人主观怠于代理诉讼、客观无法代理诉讼等情形。我国现行的民事诉讼代理制度---法定代理人制度和委托诉讼代理人制度已无法全面保护无诉讼行为能力人的合法权益,亟需打破现有的民事诉讼代理制度框架体系,引入新的诉讼代理制度
由于具有超高理论能量密度(2500Wh·kg-1),锂硫(Li-S)电池越来越多地受到人们关注,在便携式电子设备、电动汽车和可再生能源的存储系统等领域成为了下一代储能系统的强劲竞争