多姿态人眼定位与表情识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:huxiangye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和生物医学工程技术的飞速发展,利用人体生物特征来研究有关人体身份、语音、指纹、表情等的生物识别技术成为安全验证的首选方式。在人工智能研究领域,人脸作为重要的生物特征,其检测、识别和表情分析对于实现机器智能化起到很关键的作用,有着广泛的应用前景。对人脸信息的处理技术随着图像处理和模式识别的巨大进步得到了很好的发展,但是还是受到现实环境中不确定因素的影响,比如说光照、姿态、表情、遮挡等。而有关表情识别的研究更是受到不同人表情程度不同、同一人不同表情的影响,理论和方法都有待于完善。完整的表情识别主要包括人脸检测与定位、人脸表情特征提取和降维以及最终的表情分类。本文主要是针对静态图像的多姿态人眼定位、人脸表情识别的问题做了以下工作:①针对彩色图像中人脸在复杂背景及多姿态下眼睛定位困难的情况,提出了一种基于肤色分割与Gabor滤波的人眼定位方法。首先采用粒子群算法优化改进的最大类间方差(otsu)对图像进行肤色分割,找到人脸的候选区域;然后构造Gabor滤波器对候选区域进行滤波;最后经过灰度投影得到眼睛的位置。实验结果表明,本文采用的肤色分割方法效果好,应用于人眼定位方面使得定位精确度高,尤其在背景复杂和多姿态的情况下也有着明显的优势。②研究了经典的线性人脸识别方法PCA,并将其应用到人脸表情的识别中,该方法假设输入的数据具有全局线性结构,所以当遇到非线性流形上的数据时,处理的结果受到影响;另外研究了非线性特征提取方法核PCA、局部线性嵌入算法(LLE)以及核SLLE算法,并在JAFFE人脸表情库中实现了以上4种方法,结果显示,非线性降维算法在表情识别中有着更好的结果,也进一步验证了人脸空间可能是一个高维的非线性子空间,即位于一个非线性流形上。③提出了一种融合局部特征进行表情识别的算法,针对在人脸表情中贡献较大的人眼和人嘴,将二者融合起来进行表情识别,并赋予二者不同的权重系数,比起整体的特征分析,不仅节约了计算量,也在一定程度上降低了因同一个人特征相似、不同人表情程度差别大所引起的表情判别误差,提高了识别率。
其他文献
分布式视频编码(DVC)是一种新的编码框架,它主要基于两种理论:Slepian-Wolf理论(1973)和Wyner-Ziv理论(1676)。这种新的编码框架能够部分的或全部的只在解码端开发信源统计性。Wyner-
本文的研究目的是应用立体视觉技术对环柱可展开天线结构进行实际测量,从而获取天线的空间坐标。由于该天线采用轻质柔性材料制作,在各种外部因素的作用下容易发生形变,导致天线
在许多通信场景中,不同的信息需要得到不同的保护。例如,在无线网络中,控制信号比有效载荷更为重要,需要得到更多的保护,才能完成可靠的通信。这说明信息需要不等错误保护(Unequal
神经性疾病已经成为全球健康的主要威胁,其早期诊断有利于显著降低其发病率,脑核磁共振(MR)图像处理方法是神经性疾病早期诊断的有效手段,配准方法是其关键环节,直接影响其临床应
博物馆是征集、典藏、陈列和研究代表自然和人类文化遗产的实物的场所,并对那些有科学性、历史性或者艺术价值的物品进行分类,为公众提供知识、教育和欣赏的文化教育的机构或
为实现国网公司提出的智能变电站一次设备状态检修的目标,需要对已有的数字化变电站进行升级改造,增加设备状态监测系统。无线传感器网络以其不需布线、施工简单、易于扩展等优点,是设备状态监测系统网络传输的有效方式。但目前无线传感器网络在变电站内的应用还比较少,主要是因为变电站内复杂的电磁环境对无线通信的影响的研究还相对缺失,并且缺乏有效的网络组网方案。本文依托国家科技重大专项,其研究成果将为数字化变电站的
如何获得蕴含了深度信息的深度图像是发展机器视觉的关键。三维测量通过各种方法使摄像机拍摄的二维图像变成蕴含了物体深度信息的深度图像,从而获得物体的三维信息来达到认知
19世纪中叶的象征主义文学思潮是一个影响世界的文学思潮.其代表人物之一的兰波也是其集大成者,写了许多带有象征主义色彩的优秀诗篇.其一 《幽谷睡者》就是其典型的代表作品
电源是通信设备的重要组成部分,在通信网的构成中,电源通常发挥着“心脏”的作用,通信电源是向通信设备提供交直流电的电能源,是整个通信网的能量保证,其能否正常运行直接影响整个通信网络的质量。蓄电池作为通信电源系统的重要组成部分,是电源系统稳定、可靠运行和优质供电的最后保证。因此,研究蓄电池的性能和健康状况具有重要的现实意义。本文通过分析总结阀控式密封铅酸(Value Regulated Lead Ac