基于视觉词典的三维人脸识别和分类

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:wwwroot123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步和计算机网络技术的迅速发展,基于生物特征的身份鉴别算法由于其出色的安全性能受到了广泛的关注。在所有的生物特征识别算法中,人脸识别技术由于其易接受性、采集方便等优点一直是该领域的研究热点。但是由于人脸本身是一个非刚性的三维几何体,因此传统的二维人脸识别技术必然会受到光照、姿态和表情等因素的影响,造成识别信息的丢失。为了解决这些问题,三维人脸识别技术应运而生。三维人脸识别和分类就是使得计算机可以对由三维扫描仪采集得到的三维人脸数据进行智能分析,从而得到准确的身份识别和分类结果。本文针对如何准确而鲁棒的进行三维人脸特征表达进行了深入的研究,主要的工作和贡献包括:   ①实现了三维鼻尖区域的定位算法,并以此为基准区域对不同的三维人脸数据进行配准。这些工作为三维人脸识别平台的建立奠定了基础。   ②提出了基于视觉词典的三维人脸特征并将其成功应用于三维人脸识别系统中。视觉词典算法首先通过学习得到三维人脸最常见的纹理基元,然后以这些基元作为纹理直方图的基础,通过将原三维人脸图像向这些纹理基元映射得到视觉词典直方图向量,以此作为三维人脸的特征表达。实验结果表明,视觉词典特征实现了泛化能力、识别性能和鲁棒性的统一。   ③改进了基于视觉词典的三维人脸框架中的各个步骤(滤波器选择、聚类算法设计和匹配距离选择),进一步提升了该算法的识别性能。在FRGC2.0和CASIA三维人脸数据库的实验中,都取得了很好的识别效果。   ④提出了鲁棒局部Log-Gabor直方图特征以克服在非可控环境下三维人脸识别遇到的困难。该算法在FRGC2.0三维人脸数据库的大表情数据子集和CASIA三维人脸数据库表情子集的实验中,取得了很好的识别效果。   ⑤利用视觉词典特征提出了模糊三维人脸种族分类。利用视觉词典特征学习得到东方人种视觉基元和西方人种视觉基元,并以此为基础设计了模糊隶属度函数,实现了模糊三维人脸种族分类的目的。   总的说来,本文在基于视觉词典的三维人脸特征表达方向做了深入的研究,并取得了一些初步成果,希望本文的工作可以对进一步的三维人脸识别研究提供帮助。
其他文献
随着中国证券投资基金的迅猛发展,对基金业绩的相关研究也越来越受到理论和实务界的关注。对开放式基金进行科学合理的考核评级能够促进基金业健康发展,为基金投资者提供准确的
随着机器人技术的发展,具有良好环境适应能力的两栖机器人引起了人们越来越多的兴趣和重视。本文针对两栖类动物的身体结构和运动特点,结合课题组的相关研究工作,研制开发了一种
学位
永磁同步伺服电机驱动控制器在安装调试过程中常需要修改系统的参数以满足不同应用对象的性能要求,一般通过反复烧写DSP内部FLASH存储器的方法来改变PI参数,这种方法要求掉电停
数据发生器作为现代数据域测试中的通用数字信号源,可以产生大数据量、复杂多样的高速数字激励信号。随着现代科技水平的快速发展,待测设备的工作速度不断提高以及系统功能更
上世纪八十年代末发展起来的井地电位测量技术是一种新型的电测方法。通过开发井的套管向井下供入大功率的电流,并在地表测量由套管流入地层的“漏电流”在非均匀电性变化的地
在飞机的纵向运动控制中,俯仰角控制是非常重要的控制模态,飞机爬升段和下降段经常采用这种控制模态。在控制系统设计时,超调量是重要的动态时域指标之一。为了保证飞行安全,在
随着信息传播技术的迅猛发展,尤其是广播、电视等新闻报道信息流在互联网上的全面开花,互联网成为不可忽视的舆论阵地,而互联网新闻作为一种重要的情报信息来源,也在人们的生产、
学位
本文研究的自适应光学系统是用于近地大气激光通信。激光作为传输信息的载体在近地大气信道传输过程中极易受到大气湍流的影响,激光在传输过程中会受到大气吸收、大气散射、大
本论文以新松公司和山东省科学院的《井下探测救援机器人的研究》项目为依托,展开井下探测救援机器人控制系统的研究。   我国的煤炭资源十分丰富,是世界上最大的煤炭生产国
智能计算广义的讲就是基于生物体系的某些机制,用数学语言抽象描述的计算方法。计算智能是一个内蕴相当丰富的概念,它是融合神经网络、进化计算以及物理学、数学、计算机科学等