论文部分内容阅读
金丝猴是国家一级保护动物,属于濒危物种,亟需保护。对金丝猴的保护和相关研究工作都是建立在能够对其个体准确识别的基础上。传统的依靠人工识别的方法成本高、效率低下、容易受个人主观因素影响,制约了相关研究工作的进展。鉴于飞速发展的计算机视觉技术,通过利用或设计相应的计算机视觉方法对金丝猴图像数据自动进行处理与分析成为一条可行之路。卷积神经网络(Convolutional Neural Network,CNN)拥有出色的特征提取能力,在图像处理领域拥有丰富的研究和实践成果。注意力机制在图像理解过程中扮演着重要角色。本文基于CNN的基本方法和理论,引入注意力机制,对适用于金丝猴的面部识别算法进行设计,实现对金丝猴个体身份进行快速、准确的自动识别,为大数据环境下的金丝猴研究与保护工作提供技术支持。本文首先阐述了金丝猴面部识别的研究意义,并对相关领域发展现状进行总结和分析;然后,对CNN的相关基础理论进行概述和分析,进而确定了本文算法的基本研究路线;接着分析了金丝猴面部图像数据的特点,针对其背景复杂、光线多变、个体相似度高等难点,结合图像处理中的注意力机制,设计了金丝猴面部识别算法的网络结构,并通过实验对比论证其有效性;最后,基于Qt平台设计并实现了具备采样功能的金丝猴面部识别软件。(1)通过对金丝猴面部数据特点进行分析,针对面部识别任务中存在的难点,结合注意力机制设计了改进的卷积神经网络模型AKP-CNN(Attention Key Part Convolutional Neural Network),并实现一种基于AKP-CNN的金丝猴面部识别算法。该算法利用注意力推荐网络(Attention-Proposal-Network,APN)对关键特征区域进行聚焦,通过两个结构相同的网络对全局特征和局部特征分别进行提取,最终由特征融合层将两种特征融合并用于识别任务。基于APN对重点特征区域定位并聚焦的特性,本文通过启发式的方法设计了对应的特征融合机制以更好地利用不同尺度的特征。实验表明,该算法在一定程度上提高了金丝猴面部识别的准确率。(2)根据对金丝猴面部识别算法的研究,基于C++语言,使用Qt平台设计并实现了金丝猴面部识别软件。该软件利用OpenCV计算机视觉库完成对图片的加载和处理,通过开源的深度学习框架Caffe实现对网络模型的加载和图片类别的预测。考虑到野外研究工作的需要,该软件添加了对陌生数据采样保存的功能。该软件具备完整的图形化操作界面和异常问题处理机制,实现了图像读取,模型加载,结果展示等多项功能。该软件操作简单且易于学习使用,是金丝猴个体识别工作中的出色助力。