论文部分内容阅读
人脸表情识别是计算机视觉以及模式识别领域的热点研究问题,自20世纪80年代以来的三十年间受到了越来越多学者的重视。同时,作为人工智能以及情感分析的重要分支,人脸表情识别在人机交互、重症病房监护等领域具有很大的研究价值以及应用前景。早期的人脸表情识别专注于二维图片以及图片序列,也即视频上的算法实现。但是由于二维人脸图像是三维物体向二维平面的投影,在投影过程中必然会损失纹理、形状等特征,还会受到姿态、光照等因素的影响,所以近十年来,基于三维人脸点云模型的表情识别成为该领域的研究重点和中心。本文首先提出两种完全自动的基于三维点云数据的表情特征提取乃至分类算法;其次在二维表情识别领域,通过扩展已有算法得到了三种优秀的表情分类特征提取方法;最后,通过使用网络文本搜索的方法,建立接近于真实生活中人们呈现表情状态的二维人脸表情数据库。本文的主要研究工作以及提出的创新点如下:第一,提出一种基于自动获取三维及二维特征点的三维人脸表情识别算法。该算法采用在三维点云、深度图像以及三维点云对应的二维纹理图像上分别自动获得特定特征点,并将非点云上获得的特征点映射回三维点云以获得全部需用特征点的方法。基于这些自动获取的特征点得到三维欧氏距离组成特征向量分类表情,实现了完全自动的三维表情特征提取以及分类过程。第二,提出了一种通过提取所有实验对象每种不同表情点云上始于鼻尖、终止于经剪切规整过的三维人脸点云的边界的呈放射状人脸面部曲线族,并计算不同表情曲线之间的距离。最后使用自动特征选取算法获取区分度最高特征子集的方法实现自动的三维人脸表情分类识别。第三,使用一种直方图上下文情境化算法,提取由局部微纹理算子所获得直方图向量的空间组织结构特性,以进一步挖掘特征向量判别度、提高表情正确率。面部图片可以使用局部微纹理算子非常有效的表征。使用这些算子获得的表征人脸表情图片的直方图向量包含有丰富的对不同种类表情进行判别的信息。为了度量该信息,本文引入直方图上下文情境化算法来加强由局部微纹理算子获得的直方图向量的类间判别度,实验表明,此方法可以大幅度提高原始直方图向量的表情判别度。第四,扩展了一种图像空间域局部微纹理提取算法,应用算法提取时间–空间域特征向量。该算法通过分别提取表情序列各帧以及由各帧相同位置行和列组成的与各帧相垂直的两个平面(共三个平面)的WLD特征向量,连接所有特征向量组成原始表情时间–空间域特征向量。通过编码该直方图向量的上下文情境化,可以获得优异的表情分类识别结果。第五,扩展形状上下文算法,并使用该算法表征LBP编码图像以提取表情分类特征向量。该算法首先对一幅人脸图像使用LBP算法编码。编码整幅人脸图像后,在此LBP编码图像上均匀密集取点。以每一个特征点为原点使用旋转不变SC的极坐标系取得SC特征直方图。所谓旋转不变SC是指计算特征点周围的主梯度方向,以该主梯度方向作为极坐标系的初始方向指向。该直方图的每一个柱柄又由一个子直方图组成,该子直方图是SC极坐标划分的每一个区间所覆盖LBP编码图像上子区域的LBP直方图。当取得所有样本点的SC直方图后,将这些直方图连接起来组成整幅图像的特征直方图向量作为特征进行表情分类。第六,表情数据库的建立对算法的验证至关重要。但现有的表情数据库都有自己的明显缺点:实验对象稀少,表情图片不足;得到的表情数据均是在实验室严格限制条件下获得,而非日常自然表情。因此,本文提出了一种基于网络搜索组建二维表情数据库的理论框架。该理论框架包含两个主要组成部分:按照关键词文本搜索的数据库组建过程以及基于自主学习的数据库图片搜索结果精炼过程。使用此框架建立的数据库将克服以上提到的现有数据库的缺点。