论文部分内容阅读
金丝猴是国家一级保护动物,属于濒危物种,对金丝猴的保护和相关研究刻不容缓。现阶段可以采用非侵入式的拍摄方法,以获得大量的自然场景下金丝猴图像和视频数据,同时基于这些图像或视频数据对金丝猴的个体和群体的生物特征信息展开相关研究。然而对于在多个视频或图像中对特定金丝猴进行追踪和识别的任务,使用传统的人工相面的方式难以满足繁重的检测和重识别工作。本文基于深度学习的理论和方法展开自然场景下金丝猴躯体检测和再识别方法的相关研究,在多个摄像头拍摄的原始自然场景图像中检测到金丝猴目标区域,并以检测得到的金丝猴部分图像为查询示例,在金丝猴图像序列中检索出这些金丝猴个体,完成不同场景下金丝猴个体的重识别。本文首先对自然场景下金丝猴重识别研究的意义和研究现状进行阐述,然后概述了个体重识别工作、生成对抗网络(Generative Adversarial Network,GAN)以及全卷积网络(Fully Convolutional Network,FCN)的相关理论,并对FCN改进以进行自然场景下金丝猴躯体检测,以及提出基于CycleGAN数据增强的金丝猴个体重识别算法。金丝猴躯体分割为金丝猴重识别工作奠定基础,而CycleGAN数据增强方法针对金丝猴重识别任务数据有限的问题,有效提升了金丝猴个体重识别的准确率。最后,设计并开发了基于Qt开源平台的自然场景中金丝猴个体重识别的软件。(1)针对原始FCN网络的分割结果中存在金丝猴躯体分割不完整的问题,设计了基于距离权重的损失函数DWL(Distance-Weight Loss)以优化FCN网络模型。该损失函数关注的是整张图像中被选中的金丝猴感兴趣区域,并利用感兴趣区域中心到边缘的距离信息,对不同像素设置相应的权重,从而结合金丝猴躯干到边缘毛发的位置约束信息,有效提高了自然场景图像中金丝猴分割结果的准确性和完整性,最终能够生成符合重识别任务数据要求的金丝猴躯体检测框。(2)针对金丝猴重识别任务中数据量有限的问题,利用CycleGAN网络生成冬季风格金丝猴数据以实现数据增强。由于生成数据会对真实图像序列的实验结果产生消极影响,为此,本文设计了区分生成数据与真实数据的损失函数OGVL(OriginalGenerated Vary Loss),使网络模型在训练过程中更加关注训练集中的真实数据。实验表明,该数据增强方式可以有效提高金丝猴重识别准确率,且OGVL函数具有减弱生成数据的噪声影响的作用。(3)根据金丝猴目标检测和个体重识别算法的研究结果,设计并开发了基于Qt平台的自然场景金丝猴个体重识别软件。该软件包含两个主要功能模块,首先完成对自然场景图像的金丝猴检测,然后对得到的检测结果进行重识别,从而实现在原始自然场景图像中检索出特定感兴趣的金丝猴个体的功能。