论文部分内容阅读
图像语义理解是近年来计算机视觉领域中一个非常活跃的研究领域。研究的基本目的是研制自动化的算法和系统,正确解释图像内容,实现对图像数据的有效组织、管理和再利用。计算机视觉、认知科学以及机器学习领域的研究人员从不同的角度对该问题展开研究。现有计算机视觉领域中,对图像内容理解大致可分为三个层次:以感知层(低层特征)为主的图像内容分析,例如颜色、纹理、形状、轮廓、运动、时空关系等特征提取与分析的图像处理过程;认知层(中层特征)为主的图像理解:如图像、视频的主要区域、对象、场景等概念和语义。部分学者涉及情感层(高层特征)的图像情感分析,如图像情感分类、人脸表情分类、以及图像美学分析等。人脸表情分类长期以来是人们在人脸识别领域中关注的重点问题之一。现有研究成果大多针对六类表情进行分类,或对于相关运动单元进行识别。由于面部表情的多样性和复杂性,以及表情类别具有一定程度主观性,因此实现自动表情分类算法具有较大难度。但由于表情分类对于人机交互以及高层视觉语义理解具有重要价值,因此长期以来国内外很多研究机构以及学者致力于相关理论研究,并取得一定研究成果。目前表情分类大多基于惊讶、厌恶、恐惧、愉悦、伤心、愤怒这六类基本表情概念进行分类。然而,六类基本表情概念往往不能描述现实中复杂的人脸表情。因此,目前表情分类的理论以及应用研究受到一定限制。综上所述,本文结合相关心理学理论,研究细粒度的表情分类问题,论文详细分析了当前情感分类以及表情分类的现状,并阐述了相关的心理学概念。本文定义30个细粒度表情概念,并构建首个大规模细粒度表情分类数据库,深入分析数据特征,对于细粒度表情分类别进行了描述,并且结合当下人脸分类的相关研究手段对目标问题进行了不同特征的对比性实验。论文主要工作包括:第一,深入分析了表情分类研究现状,对现有的多种表情分类方法进行了综述与分析;第二,构建了首个大规模细粒度表情分类数据库,为相关研究者提供了必要的分析基础;第三,研究表情分类特征提取与分析问题,提出一种有效的细粒度表情分类方法。通过大量实验验证,证明所提出算法具有较好的分类效果。