基于量子势垒的说话人识别系统的研究与实现

来源 :贵州大学 | 被引量 : 1次 | 上传用户:lisky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音不仅是人与人之间信息的沟通的媒介,也携人自身与众不同的特征,同时也具有共性及各自独立的变性等特征。声纹特征是一种生物特征,它包含着说话人生理、物理构造不同的特征,不易被他人模仿、伪造,具有较高的专一性。随着信息技术的发展,越来越多的民事甚至刑事案件因声纹特征而引起的涉及身份伪造等一些列原始性、真实性的相关案件,为司法取证及公安执法取证带来诸多困难,因此,对说话人特征提取极其有效辨识,为协助公安办案、司法取证具有重要的意义。论文尝试从量子力学理论角度出发,对说话人的特征提取方法的这一新尝试进行研究,假设量子势垒就对应一个滤波器,利用信号与量子势垒的隧穿效应,并联系能量与频率的对应关系,建立势垒组量化了不同能量的多帧语音中的透射能力,将多帧通过势垒组时的隧穿频数的概率作为特征参数,从而建立不同人的语音特征,在对其特征进行高斯混合模型训练,通过编程实现检验其识别能力与效率。论文主要工作如下:(1)研究在Windows下的语音处理,并利用Windows API实现语音信号的录入、预处理、端点检测、分帧等声纹预处理过程;(2)从量子势垒理论中,找到与MFCC算法的相同点,实现量子势垒特征提取方法;(3)对特征提取后得到的参数进行处理,保证了与后面高斯混合模型所需参数的有效匹配;(4)在系统实现上,各个功能模块进行了详细设计,并对最终实现的系统进行了小范围试验,找到在不同录音帧数、不同高斯混合数对识别效率的影响。对比分析的结果表明,当隧穿每组帧数k固定时,录入的有效帧数(训练时长)越多,识别正确率越高;高斯混合数M越大,识别正确率越高,但识别耗时也会相继增长;当录入的有效帧数和高斯混合数等其它环境条件都不变时,隧穿每组帧数越大,正确识别率越高。
其他文献
近几年,随着GPU等计算机硬件的快速发展,使计算机的并行计算能力大幅提升,卷积神经网络等深度学习算法迅速崛起,各种基于生物特征的身份识别技术得到了越来越广泛和深入的研
随着4G网络的普及,以及越来越强劲的终端处理能力,人们对视听类体验的需求逐步升级,更高品质的多媒体业务越来越受到业界的重视,多媒体视频彩铃业务的发展迎来了一次新的契机
随着监控网络的广泛覆盖,视频目标跟踪已经广泛应用于军事、医疗、交通和公共安全等领域。目标检测跟踪通过提取目标的有效特征,获取目标状态。传统的目标跟踪方法在遮挡和目
本文研究在高速运行环境中,基于蜂窝信息站集成网络的非均匀宽下动态效用无线报文调度算法,包括无特定用户带宽限制的调度算法和具有特定用户带宽限制的调度算法。在蜂窝信息
基于手形、掌纹等手部单一生物特征不可能实现完美的身份识别系统,基于手形和掌纹的双模态生物识别技术是多模态生物特征融合的一种新的研究方向。本课题在分析手形和掌纹两
随着多媒体技术的发展,图像在互联网信息中占有越来越重要的比例。因而,如何快速、有效的管理这些丰富而直观的信息,逐渐成为当前科研人员和技术工作者关注的焦点。分形理论
人脸识别是图像处理、计算机视觉、模式识别等领域研究的热点话题,近些年研究学者提出了许多的经典算法,并广泛应用于公共安全,视频监控。线性判别分析(LDA)和稀疏表示(SRC)
正交频分复用(OFDM)指数调制(IM)是一种典型的多载波调制技术。相比于传统的OFDM,在快时变信道下,OFDM-IM对子载波间干扰(ICI)具有更强的鲁棒性。另外,OFDM-IM能够在不增加调
对话管理(DM:Dialogue Management)在人机对话系统(DS:Dialogue System)中扮演着重要角色。基于马氏决策过程(MDP:Markov Decision Process)的对话管理建模取得了不少进展,但
大庆油田总医院信息系统是应用计算机和计算机网络为医院所属各部门提供病人医疗信息、财务核算信息、行政管理信息和决策统计信息,对这些信息进行收集、存储、处理加工以满