论文部分内容阅读
眼睛作为脸部的重要组成部分,可以反映出许多重要的信息,对人眼的定位及眼睛的睁闭状态分类可以有效的辅助人脸检测、表情识别、姿态估计和人机交互等计算机视觉领域相关工作。此外,通过对人眼的定位及状态分类可以计算眨眼频率并以此判断疲劳状态,相比传统的利用心电或者脑电监测疲劳的穿戴式设备更为简单快捷。传统的人眼定位及状态分类的方法经常受到脸部表情、姿态变化、光照、遮挡、背景干扰、图像清晰度等因素的影响,因此研究一个兼具准确性、实时性和鲁棒性的方法具有十分重要的意义。而随着深度学习的发展,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉领域有了广泛的应用,相比传统手段,卷积神经网络能自动对图像特征进行提取,在目标定位和目标检测中都有良好的表现。因此,本文将针对传统算法中存在的问题,结合卷积神经网络进行人眼的定位及睁闭状态分类,具体工作如下:(1)提出了一个检测人眼中心点的卷积神经网络,当输入人脸图像时,该网络能快速得到双眼中心点,并输出中心点对应的坐标值;根据中心点坐标值及一定的宽高值确定眼睛区域后得到人眼图像;然后将人眼图像输入一个眼睛睁闭状态分类网络,得到眼睛的睁闭状态。实验结果表明,该算法相比传统方法更具鲁棒性和实时性,具有良好的应用前景。(2)基于SSD网络(Single Shot MultiBox Detector,SSD)采集了相应的实验数据集,该数据集包含人脸、双眼、鼻子和嘴的坐标位置,并标注了眼睛的睁闭状态。利用该数据集训练了一个能够进行人脸检测、人眼定位及睁闭状态分类的SSD网络。当输入一幅图像,该网络可以直接检测得到眼睛区域及睁闭状态。当眼睛目标过小时,该网络也可以先检测得到人脸区域,再通过对人脸区域的检测得到眼睛区域及睁闭状态。该方法不受额外的人脸检测器的约束,能够更好的应对姿态变化等因素的干扰。(3)将上述提出的算法应用于疲劳检测中,实验结果表明,基于卷积神经网络的人眼定位与状态分类的方法能够实现准确、实时的疲劳检测,该方法硬件需求低,能够应用于实际生活中。