论文部分内容阅读
近几年来,随着人工智能的蓬勃发展,人脸检测作为最热门的研究课题之一,应用于许多社会生活中的实际场景中,例如手机支付、智能安防、自动驾驶等。YOLO网络一经问世就因其检测的实时性能备受瞩目,同比于目前实用的检测网络,YOLO有检测速度的优势,但同时也相对牺牲了检测精度,YOLO网络发展到第三代,网络结构加深,检测精度得到改善但同时检测速度有所降低。随着基于深度学习的人脸检测网络的快速发展,如何适用于实际的社会生活中面临了较大的困难与挑战,比如过小且像素过低的目标、模型参数过多占据存储空间过大、检测的速度和精度无法权衡等。针对上述问题,本文在基于回归思想的YOLO网络的基础上,提出一种新的网络模型,本文的主要研究内容如下:(1)针对于人脸数据集,研究不同数量的anchor对网络模型的影响,使用无监督算法k-means++对人脸数据集的宽高进行重新聚类,获得适用于本文人脸数据集的边界框大小和数量。(2)针对非极大抑制存在漏检邻近人脸的问题,提出一种基于加权的非极大抑制算法,对预测框中得分低的预测框不做直接抑制处理,而将其降低得分,并与设定的重叠阈值做比较,低于阈值再做抑制,否则视为检测框输出。该方法避免了邻近人脸的漏检问题,一定程度的提高了检测准确率。(3)针对人脸检测复杂场景中远近人脸的大小比例悬殊,存在放弃小目标人脸检测大目标的问题,提出了一种新的损失函数,将位置预测误差的宽高使用对比度的方法进行计算,并且针对单一样本的小目标,使用Focal loss计算类别预测的损失函数,通过参数调节正负样本比例,提高小目标的权重,使小目标的检测结果得到有效提高。(4)针对用于分类的传统深度卷积网络存在参数过多且占据存储空间过大计算成本过高的问题,使得网络模型很难部署于计算能力和内部存储空间相对有限的移动设备上。本文针对传统卷积神经网络进行优化方案分析,使用深度可分离卷积层、逆残差的线性瓶颈层和SE模块对深度卷积网络进行优化,将MobileNetv3作为分类网络结合YOLO层形成新的轻量级检测网络Deft-YOLO。经实验证明本文网络有效的降低了模型的计算成本且大大减少了存储空间,并保证了检测精度没有损失。