论文部分内容阅读
伴随社会不断进步,人工智能(Artificial Intelligence,AI)研究发展迅速,图像识别技术(Image Recognition)也得到充分发展。而在图像识别技术中,人脸识别(Face Recognition)相比于指纹、虹膜、语音等其他生物识别(Bio-identification Technology)技术具有非入侵、易获取、易存储、精度高、鲁棒性好等优势,已被广泛应用公共安全、身份识别、娱乐应用等各个领域当中,成为图像识别技术最热门主题之一。目前,大部分人脸识别系统主要应用于干扰较少且目标为静态图像的固定场景中。本文主要研究视频流中的人脸识别问题,分析了传统人脸识别方法在视频流中的局限性缺陷,提出并改进了基于深度学习的人脸识别方法。对视频流中人脸进行身份识别主要分两步进行:先通过视频数据定位和检测人脸,再对检测到的人脸进行识别。在人脸检测(Face Detection)阶段,本文采用深度U-Net结构与残差网络结构(Residual Network)结合的方法检测人脸,该方法不需要设置默认检测框,是一种Anchor-Free的人脸检测方法。在人脸识别(Face Recognition)阶段,本文先提取人脸特征,再通过对人脸特征向量进行相似度计算来识别人脸。本文通过在深度U-Net网络框架中加入残差结构,实现人脸特征提取。U-Net是一种基于全卷积图像分割方式的特征提取,利用网络中间底层作为输入人脸图像特征向量,该向量具有全面的代表性。本文所提出的人脸识别达到了较好的效果。本文主要有以下创新点:(1)人脸检测阶段,提出了一种基于深度残差网络的算法,该算法相比于其他人脸检测方法,是一种Anchor-Free方法,精度高、开销低。(2)在人脸特征提取阶段,本文基于深度残差网络的全卷积神经网络(Fully Convolutional Networks,FCN)特征,实现人脸图像的编码和解码工作,提取中间层为人脸特征向量。该方法不需要人为设置特征向量提取器,且该特征向量几乎包含所有人脸图像信息,具有综合性。