【摘 要】
:
针对单模态的说话人识别和人脸识别在准确率,应用的限制性和局限性等方面的缺点,本文从信息融合的角度出发,在特征层将两种单模态信息进行融合,实现音频信息和视频信息双模态
论文部分内容阅读
针对单模态的说话人识别和人脸识别在准确率,应用的限制性和局限性等方面的缺点,本文从信息融合的角度出发,在特征层将两种单模态信息进行融合,实现音频信息和视频信息双模态特征融合的身份识别。本文首先就单模态的说话人识别和人脸识别进行了分析。结合VQ和SVM识别模型各自的优点,实现了一种基于VQ和SVM混合说话人识别模型。对于特征脸人脸识别算法,本文用L1-范数,欧氏距离,MIN距离和混合马氏距离四种度量距离对算法进行了比较。然后将脉冲耦合神经网络应用到人脸识别中,并在此基础上建立了人脸识别系统。其次本文重点对双模态的音视频特征融合识别进行了研究,由于特征层融合可用的信息量大,可以用于实时处理,故本文实现了基于归一化和SVM,基于PCNN两种融合识别算法在特征层对音频和视频特征进行融合识别。前者本文是利用特征相连法将语音特征和人脸特征相连在一起,后者是将两种特征的熵序列融合在一起。实验表明,融合系统的识别率都要比单模态的识别率要高,特别是将噪音加入到语音信号后,单个说话人识别系统识别率下降很快,但是融合识别系统的识别率却能保持在一个良好的水平上。
其他文献
土地利用规划实施评价对于落实动态规划、强化实施具有重要意义。结合土地利用总体规划实施评价的特点和模糊方法要求,以探讨和实践一套系统科学的规划实施评价方法为目的,提
组蛋白的乙酰化/去乙酰化、甲基化、磷酸化、泛素化等共价修饰对生物体的染色质结构和基因表达起着重要的调控作用。作为一种重要的组蛋白共价修饰,组蛋白甲基化在异染色质形
[目的]评价区域协同护理远程教育模块的应用效果,找出改进、完善模块的关键措施,不断完善模块的功能和质量,提高模块的应用效果。[方法]对加入盛京医疗联盟护理信息化网络平
两千年来中国和日本的文化交流,两国学者已经从很多方面作了深入的考察。我于这一专门领域之门外,这里无我可以置喙之余地。之所以写这篇短文,只是想借这次两国史学家集会的
教材编写是一项涵盖语料的选取,汉语词语、语法和功能的设计,练习体系建构等多方面复杂而系统的工程。对于一部好的汉语作为第二语言的教材,其练习的设计与编排是十分重要和必要
15-16世纪葡萄牙西班牙地理大发现,到17世纪荷兰资本的力量;1688英国光荣革命工业时代,到1789法国大革命;1871德国统一,到1871日本岩仓使节团出访欧美;沙皇改革强国之路多舛,到
本文通过对我国大陆和台湾地区简易刑事程序的比较,深挖其产生的历史根源,来剖析其现实差异存在的原因,并通过对具体制度的评析比较,为我国刑事简易程序的完善和发展谏言献策
分布式发电系统的接入改变了配电系统的故障电流分布以及原有配电网保护配置的基础条件,对配电网系统相间短路保护设备可能造成影响。文中详细分析了不同重合闸方式下,分布式
胡锦涛“人的发展理论”是在科学认识我国人的发展现状的基础上,应我国人的发展的新要求和中国特色社会主义建设的要求而提出的。这一理论深深植根于中国特色社会主义建设的
随着科技的快速发展,越来越多的新型战斗机不断地引入,未来的空战对飞行员的身体和心理提出了更高的要求。飞行基础训练阶段,是飞行员训练成长的一个重要时期,此阶段对飞行学