论文部分内容阅读
基于卷积神经网络的目标跟踪和表情识别算法已经被广泛用于多个领域,如视频监控,人机交互和自动驾驶等。然而,在无人机和云台自动跟踪等领域中,算法不仅需要对目标进行实时跟踪,而且还需要自动获取目标并识别。此外,在一些跟踪的应用场合,例如,对犯罪嫌疑人,逃票者和作弊者等跟踪,还需要对跟踪的人物目标进行人脸表情识别,以进一步判断该目标是否为真正的违法者或者违纪者。因此,对目标跟踪算法的研究以及跟踪人物的人脸表情识别具有非常重要的研究意义和应用价值。虽然,目前的单目标跟踪器能够在多个基准测试中获得较好的性能,但是它们仍无法自动检测到目标的类别。而多目标跟踪器由于存在漏检和误检等缺点,造成了其跟踪精确度和鲁棒性较差。此外,上述跟踪器大多不具备自动获取目标的功能。而对于跟踪目标的人脸表情识别,目前基于深度学习的人脸表情识别算法在实际场景中的识别效果仍不是很理想,在识别准确率和模型参数上仍有较大的提升空间。因此,为了解决上述目标跟踪和人脸表情识别算法存在的问题,本文主要开展了目标跟踪和人脸表情识别的研究,完成的主要研究工作如下:1、一种改进的基于卷积神经网络的目标跟踪算法(1)提出了一种改进的目标跟踪算法(YOLOv3-DWSiam RPN),该算法主要由检测网络(YOLOv3)、智能选择策略、更深更宽的孪生网络(DWSiam RPN)和卡尔曼滤波器组成,实验结果表明:该算法能够在复杂的背景环境下,自动获取目标并实时跟踪和检测目标(26帧/秒),其在COCO数据集的检测平均精度(m AP)为55.5,在VOT-2017数据集的目标跟踪平均重叠率(EAO)为0.30,具有较高的检测和跟踪精度以及较强的鲁棒性。(2)为了自动获取感兴趣的目标,本文提出了一种智能选择策略,该策略根据四个影响因素(类别,面积,检测精度和速度)计算出物体的分数值,并将最高分值的物体作为感兴趣目标。同时,该策略能够根据不同的应用场合设置相应的参数,具有较高的灵活性和可扩展性。由于该策略是检测网络与跟踪器的关键连接部分,其为目标检测与跟踪算法的有效结合提供了有价值的参考。(3)针对目标存在被遮挡和短暂消失等问题,本文结合了卡尔曼滤波算法对短暂丢失的目标进行预测,实验结果表明:采用卡尔曼滤波算法能有效地解决匀速运动的目标短暂消失等问题,具有一定的实际应用价值。2、一种基于改进残差网络的人脸表情识别算法(1)为了进一步提高表情识别的准确率,本文提出了一种基于残差网络(Res Net)和压缩与激励网络(SENet)的人脸表情识别算法(SE-SRes Net18)。首先,该算法针对表情识别数据库存在训练数据较少等问题,采用了随机裁剪以及水平翻转两种数据增强的方法对数据进行扩充;其次,为了提高识别精度,该算法在改进残差网络的基础上嵌入了压缩与激励网络;最后,为了防止过拟合,该算法在平均池化层和全连接层之间增加了裁剪(dropout)机制。实验结果表明:提出的人脸表情识别算法(SE-SRes Net18)在两个人脸表情识别数据集(FER2013和CK+)上的识别准确率分别为74.14%和95.25%。与目前先进的表情识别算法相比,不仅提高了人脸表情识别的准确率,而且减少了网络模型的参数,性能得到了一定的提高。(2)为了探究网络深度对人脸表情识别(FER)准确率的影响,本文在SE-SRes Net18网络的基础上增加了多个卷积层,设计出了一种26层的SE-SRes Net26网络模型。实验结果表明:与SE-SRes Net18算法相比,进一步增加SE-SRes Net算法的网络层数,并没有提高算法在FFE2013和CK+数据集上的表情识别准确率(73.59%和94.34%)。(3)针对SENet不同缩减比例r对SE-SRes Net18性能的影响,本文在SE-SRes Net18网络的基础上,设计了一个r=4的网络模型(SE-SRes Net18_r4)。实验结果表明:与SE-SRes Net18算法相比,进一步减小缩减比例r,并没有提高算法在FFE2013和CK+数据集上的表情识别准确率(74.06%和94.44%)。3、一种在线人物目标跟踪和表情识别系统为了验证YOLOv3-DWSiam RPN和SE-SRes Net18算法在实际应用场景中的性能,本文结合最新的Center Fcae人脸检测器,设计出了一种在线人物目标跟踪和表情识别系统,该系统由目标检测与跟踪模块(YOLOv3-DWSiam RPN)、人脸检测模块(Center Face)和表情识别模块(SE-SRes Net18)组成。实验结果表明:该系统能够在复杂背景环境下自动获取感兴趣的人物目标,并对该目标进行自动跟踪和人脸表情识别,具有较好的潜在应用价值。