论文部分内容阅读
随着人工智能时代的到来,行人、人脸检测及人脸识别技术已经成为研究的重点。智能监控系统是人工智能应用的一个重要场景,在智能监控系统中,必须解决视频中行人的身份识别问题。考虑到监控场景中,光照、目标距离设备较远等原因,导致视频中出现了大量的尺度较小、模糊不清等低分辨率目标,加大了检测和识别的难度。针对该问题,本文在视频场景中重点研究了低分辨率行人与人脸检测和识别的技术,获得了较好效果,主要内容如下。第一,行人人脸识别是确认行人身份的主要手段之一,这要求算法具有行人目标与人脸目标的检测能力,智能监控系统中要求行人与人脸的检测是一一对应的关系,当前少有统一实现行人、人脸一体化检测的算法,基于该情况,本文在MTCNN检测算法的基础上,进行了一系列调整与改进:对MTCNN的整体构架进行了重构,实现了MTCNN算法由“人脸检测”到“行人+人脸”检测的过渡,形成了“先行人后人脸”的检测流程,降低了检测的计算复杂度,提高了检测效率。本文对各级子网络进行了针对性的设计与改进,首先在P-Net的基础上,对网络的结构、卷积核以及各卷积层的输出维度等做了适应性改进,使改进后的网络更有利于行人检测;然后在算法的第二阶段中,本文设计了一个基于多级特征融合的全卷积神经网络,通过将低级、细节特征与高级、抽象特征融合,加强了特征的重用性,弥补了高层特征的语义缺失,增强了高层特征的表达能力,提高了网络对低分辨率人脸目标的检测能力;在算法的最后阶段,本文设计了一个基于金子塔池化的卷积神经网络,使行人与人脸目标的筛选可以共享同一个网络,同时在网络中使用了Batch Normalization,使网络不仅可以同时处理行人目标与人脸目标,而且使网络的分类性能有更好的提升。第二,针对主流的人脸识别算法在低分辨率人脸的识别准确率明显下降的问题,本文深入研究了一种基于卷积神经网络的低分辨率人脸识别算法——DCR模型。为了进一步提高DCR模型对低分辨率人脸的识别能力,本文结合了“二步法”与“跨空间法”的优点,提出了一种基于超分辨率重构的DCR模型。首先设计了基于人脸特征的超分辨率人脸重构模型,利用“感知损失+分类损失”做为重构网络的损失函数,利用人脸特征对重建过程进行约束,使重构生成的人脸更有利于识别。然后对DCR模型进行了一系列的改进与调整,首先对主网络的网络结构进行了改进,将其跨层连接方式改为密连连接,进一步促进网络中的特征传播,增强特征重用性;并对主网络的损失函数进行了改进,使用了改进后的“三元损失”作为损失函数,直接针对高分辨率与低分辨率之间的人脸特征进行优化,进一步增强了高、低分辨率人脸特征之间的聚合性;同时本文对DCR模型的训练方法进行了调整,添加了主网络与分支网络联合训练的步骤,进一步优化DCR网络参数。本文的算法,在DCR模型的基础上,有效提高了对低分辨率人脸的识别准确率。经试验分析,本文的行人、人脸检测算法可以有效的对行人、人脸目标进行检测。网络中的融合多级特征的机制,有效的提高了算法对低分辨率人脸目标的检测能力,对小尺度、低分辨率的人脸目标由原来的60.7%,提高到63.1%。在低分辨率人脸识别中,本文设计了SR-DCR模型,在DCR的基础上,进一步提高了低分辨率人脸的识别率,且分辨率越低,提升效果越明显。同时SR-DCR模型对不同分辨率具有良好的适应性。