基于人脸与语音信息融合的身份识别技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wgp54178
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物特征识别横跨了计算机技术和生物技术两大科技领域,近年来已广泛应用于金融、公安、军事等领域。鉴于单模的身份识别技术在准确率、用户接受程度、成本等方面都有不同的缺点,并且适应于各自的应用场合。这些问题可以由多生物特征识别技术来克服。本文从融合多种信息的观点出发,提出了融合语音信号和人脸图像信息的身份识别技术。重点研究了人脸特征提取后数据量大以及一般语音特征参数大都采用平稳信号的分析方法提取的问题,分别应用模糊粗糙和小波变换技术加以解决,以期达到提高识别系统的识别率的目的。 本文研究工作主要围绕以下2个方面进行: 第一、基于模糊粗糙集属性约简的人脸识别技术。针对 PCA 方法进行人脸特征提取后数据量较大的问题,利用粗糙集中的属性约简技术进行处理取得了一定效果。然而约简处理之前必需的离散化造成了某种程度的信息损失,从而影响识别精度。故本文引用了模糊粗糙集合理论,利用数据相似程度对属性值为实数值的数据集合进行约简,避免对原始数据集合进行离散化,约简结果能完整地反映原信息系统的分类能力,从而提高识别精度。 第二、一种基于数据融合的身份识别方法。首先将小波变换与 MFCC 参数提取技术相结合,提取一种新的语音特征参数基于离散小波变换的美尔系数(DWTMFC);其次应用上述提及的模糊粗糙集属性约简技术对人脸特征信息进行约简处理;最后对人脸与语音特征信息利用支持向量机在特征层进行融合识别。 实验结果表明,以上的研究工作实现了即定的目标,能够取得较理想的识别结果。
其他文献
新闻视频是人们获取信息的主要媒体,但如何快速、准确地从海量的新闻视频数据中找到所需的内容成为一个迫切需要解决的问题。新闻视频中的字幕高度概述了相关的新闻事件,为新闻
以光纤通信为代表的传输网构架了现代通信最重要的基础网络,为各类电信业务网提供传输通道和对传输通道进行调度保护,对传输网进行管理是整个网络管理系统的重要组成部分。随
数据采集设备是远程自动抄表系统中至关重要的部分。目前国内电力市场流行的数据采集设备大多采用8位单片机设计开发,存在运行效率低、速度慢、可管理存储容量小、可扩展性差
随着计算机辅助设计技术的飞速发展,人们不仅把计算机作为一种实现设计方案的可视化工具,同时已经开始将机器智能应用在设计工作中最为重要和根本的概念设计阶段,激发设计师
数据格式是一个需要关心的问题。就像磁盘有不同的文件系统格式一样,磁带的组织也有不同韵格式。一般备份软件会支持若干种磁带格式,以保证自己的开放性和兼容性。但使用通用磁
随着Internet的普及和WWW的迅猛发展,人们可以通过网络在浩瀚的信息海洋中漫游。然而,由于信息的爆炸式增长,很多Web经验不足的用户经常会“迷失”在其中,他们往往因为找不到所需
随着语义网出现,提出了一个人工智能网络与人类世界结合的远景,作为文化艺术领域内的概念参考模型也经过多年的发展,产生了一些针对文化遗产、可应用在博物馆领域知识底层的本体
Internet的出现和普及使计算机应用已经全面进入Internet时代,软件构件也经历了从传统集中式应用构件到分布式的松耦合网络构件的变革。网络构件是一种崭新的分布式计算模型,是
计算机技术、传感器技术以及通信技术的不断发展,有力的推动了数据采集系统的不断发展和创新。数据采集系统在当今工业设备检测诊断中起着关键作用,本文以宝钢工业技术服务有限
近年来数据挖掘引起了信息产业界的广泛关注,其主要原因是存在大量的可用数据,并且迫切需要将这些数据转换成有用的信息和知识。通过数据挖掘,可以将知识发现的研究成果应用