基于支持相量机的稳键说话人识别

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hijklmn123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别属于生物识别的一种,是指从说话人的一段语音中提取出说话人的个性特征,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或确认的目的。它被认为是最自然的生物特征识别身份鉴定方式。由于语音是个人所固有的特征,人的语音可以非常自然的产生,训练和识别时并不需要特别的输入设备,诸如个人电脑普遍配置的话筒和到处都有的电话都可以作为输入设备,因此说话人识别系统的价格也较低,上述原因促使语音成为人们愿意接受的一种生物特征。尽管目前说话人识别技术已经取得了相当大的进展,但是将说话人识别技术大规模的应用到实际还有很多问题有待于解决,是当前生物特征识别领域研究的热点。本文研究了基于支持向量机的说话人识别,通过理论分析和实验结果得知,基于SVM的说话人识别虽然可以取得比较好的效果,但当数据规模增大时,识别效率下降比较快,缺少对大规模数据的处理能力。为了弥补基于SVM的说话人识别的这个缺点,本文对基于GMM的说话人识别进行了研究,提出基于SVM+GMM的说话人识别方法,将两种识别方法的优点进行了结合。实验结果表明,该方法可以取得比其它两种方法都好的识别性能,并且它既有处理大规模数据的能力又可以在训练样本不足的情况下得到较高的识别率。本文在研究了双分界面的支持向量机这种新的分类器模型后,提出了将TWSVM模型应用于说话人识别的方法,并采用一种新的结合方式将其与GMM模型结合起来,从而得到基于TWSVM+GMM的说话人识别方法体系。该方法是使用GMM模型进行特征提取,将得到的特征参数作为输入进行TWSVM模型的训练。实验结果表明,基于TWSVM+GMM的说话人识别方法在识别效率上已经超过了传统的SVM方法,并且比它具有更好的大规模数据处理能力。在训练样本充足的情况下也已经接近于基于GMM模型的方法。根据本文提出的说话人识别算法,设计实现了基于支持向量机的说话人识别系统,本文对该系统的设计框架、系统实现、系统性能等作了详细的介绍。
其他文献
Linux系统是一种分时的、具有强大网络功能并开源的通用目的操作系统,它诞生于上世纪90年代初,以网络为基础广泛传播到世界各地并成为当今主要操作系统之一。因为Linux操作系
随着互联网上邮件的广泛使用,垃圾邮件的问题变得日益严重,它不仅消耗网络带宽和计算机时空开销,而且会对企业的正常运行和用户的正常工作造成严重的干扰。要解决垃圾邮件问
相容信息粒度空间是一种基于相容关系构建的粒度计算模型,该模型的优势在于对现有知识、资源和信息能进行不同层次和不同粗细程度的粒化并构建粒之间的关系,从而更好地发掘这
网络技术飞速发展并被广泛应用于社会生活的各个方面,PC终端的数据信息安全也变得日益严重。在国内Windows PC终端普遍应用,该终端安全机制较为薄弱,其上存放的敏感信息成为
实时图像处理技术应用十分广泛,其应用的系统具有实时性、数据吞吐量大等特点,一方面其应用领域之广对处理系统的灵活性有较高的要求,另一方面在短时间内处理大量的数据对处
随着我国工农业生产的发展和人们生活水平的提高,作为国民经济的基础之一,电力行业取得了迅猛的发展,电力系统的送配电安全性和可靠性也越来越受到电力系统运行、管理和科研人员
随着多核处理器的发展,对并发程序的研究已成为程序设计的热点。然而,并发程序的交错执行存在不确定性,这导致了传统的测试、仿真、演绎推理技术很难发现程序中隐匿的错误和漏洞
随着软件系统的规模和复杂性的增加,软件体系结构的选择成为比数据结构和算法的选择更为重要的因素,三层客户/服务器体系结构为企业资源规划的整合提供了良好的框架,是建立企
随着移动通信快速发展和普及,由于其可漫游使用的特点,其欠费风险问题越来越突出,给运营商带来了大量欠费,形成呆帐,导致收入流失。从技术上解决欠费风险问题成为移动运营商
对等网(P2P,Peer-to-Peer)已经成为Internet中最重要的应用系统之一。然而,P2P系统具有的开放、匿名以及节点之间松耦合的关系等特性使得节点可以恣意散布非法内容,滥用网络