说话人特征提取和识别算法的研究

来源 :兰州理工大学 | 被引量 : 2次 | 上传用户:shuiqianzeqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别以其独特的方便性、经济性和准确性等优势在公安、司法、声控以及军事等领域有着广阔的应用前景。如何从大量的语音数据中提取反映说话人个性特征的语音参数和设计行之有效的分类器是说话人识别领域研究的热点。针对支持向量机法(Support Vector Machine,SVM)和核Fisher判别方法(Kernel Fisher Discriminant,KFD)存在的问题,本文提出了自己的解决方案。1.针对说话人识别中语音数据维数高和识别模型训练慢的问题,提出基于主分量空间的PCA分类方法和基于截断误差空间的PCA分类方法,在保证识别性能的情况下,可以有效地降低后续阶段的计算复杂度。2.针对SVM不能直接处理动态时间序列语音数据的问题,提出一种基于添加原始分类信息Fisher分值法(AOI-Fisher score)的序列特征提取方法。为了解决AOI-Fisher分值法计算复杂度高的问题,采用PCA对MFCC参数进行降维的同时筛选出可能的目标说话人,缩小说话人的范围,减少输入样本的数量。该方法可以提高SVM在整体语音数据上进行分类的性能,同时又可降低系统的建模时间。3.提出一种基于TES-PCA和核Fisher判别(KFD)的多级说话人确认方法。PCA分类器实现简单,可以快速的判断出可能的目标说话人,然后采用KFD进行最终的说话人确认。该方法克服了KFD的计算复杂度随着样本规模的增大而提高的缺陷。相比于传统的SVM分类器和KFD分类器,仿真实验结果表明多级分类器具有较高的识别率,同时在建模时间和识别速度方面占有较大的优势。
其他文献
随着互联网的不断普及,网络已经跟人们的日常生活密不可分,作为网络管理者,如何在迅速有效地检测网络异常情况的同时,准确地判断和控制整个网络的异常流量,供有关部门作决策分析,已
随着数据的爆炸式增长,信息处理已经成为人们获取有用信息不可缺少的工具,文本分类也已成为重要研究方向。作为非监督学习方法的模糊聚类分析已成为文本分类研究的热点,对基
本文的目标是在NFC手机平台上设计并实现基于RFID标签和ECC组合公钥体制的防伪验证系统。想法是,让日常生活中随身携带的工具——手机,成为方便快捷易用的防伪验证工具。利用NF
随着电子制造及集成技术的发展,无线设备的体积越来越小,功能却越来越强大,相关的应用领域也越来越广泛。由小的无线设备组成的无线传感网络在生产活动中,如环境监测,动物跟
近年来,随着人们对无线传感器网络(Wireless Sensor Network, WSN)理论研究的不断深入,其应用领域迅速的扩展到了我们生活中的各个方面。野外火灾的特点是破坏性强、蔓延速度快,采
VRML是一种虚拟现实建模语言,它的基本目标是建立因特网上的交互式三维多媒体,它以因特网作为应用平台,作为构筑虚拟现实应用的基本构架。它的出现及其发展改变了网络的二维
随着计算机技术的发展,数字图像处理技术已经成为视觉图像研究的主要手段。但是,迄今为止人类还未能构建出一种达到高等生物视觉性能标准的自主视觉系统。其中,有一个重要因素就
无线传感器网络是一种特殊的Ad-Hoc网络,它具有自组织、快速展开、抗毁坏性强等特点,在军事、环境监测、医疗健康、工业控制等方面有着十分广阔的应用前景。近年来,随着微电
企业为了在日趋激烈的市场竞争中立于不败之地,需要不断优化其生产、经营过程,因而对业务过程的高效组织和管理成为提高企业效益、增强企业竞争力的重要手段。工作流建模作为一
众所周知,UML是半形式化的。Petri网虽然是形式化的工具但本身又有不便于应用的缺点。所以论文的目的是把UML活动图模型转换为PNML,以便能够用Petri网分析工具来分析UML所描