基于小波变换的说话人语音特征参数研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yinqing68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是利用说话人的语音特征对说话人的身份进行辨认或确认。在说话人识别系统中,最重要的是能够从语音片断中提取代表说话人独有特征的稳定参数。 针对短时傅立叶分析在提取说话人特征参数时的缺陷,本文通过对小波理论和说话人识别技术的研究,借鉴了一种传统的基于听觉机理的特征参数MFCC(Mel频域倒谱系数),利用小波变换、小波多分辨分析和小波包变换,构造出了两种基于小波变换的说话人识别特征参数:IWPTC(不完全小波包变换系数)和WPTC(小波包变换系数)。通过在Matlab平台上构建的说话人识别系统(包括文本有关和文本无关),验证了这两种参数的有效性:它们的识别率均高于MFCC参数。理论和实验证明,利用小波变换提取的说话人识别特征参数相比于传统的短时分析方法确实具有更好的识别特性。
其他文献
传统的CORBA架构长久以来都是通过对TCP/IP协议族进行GIOP(通用网间互操作协议)的映射以形成IIOP协议,借助于ORB(对象请求代理),客户桩(Stub),服务框架(Skeleton)和可移动对
随着科学技术,特别是信息技术的发展,图象处理技术已经成为科学研究不可缺少的强有力工具。从60年代开始,首先在航天领域采用计算机图象处理方法处理从月球传回的照片取得硕果。
信息检索(Information Retrieval,IR)是从数据集中提出相关文档和信息的过程,而Web的出现改变了人们进行信息检索的方式,信息检索的对象也从结构化的数据转向半结构化,无结构化的
  基于过程的服务合成实现企业内部与企业之间的业务流程的整合正成为目前的研究热点。独立的服务被称作组件服务,合成服务被表示为业务流程。通常,在INTERNET上,存在大量提供
人类的应用需求正迅速朝着高性能、大数据量的方向发展,许多大规模科学计算应用需要由多个系统合作、不同容量规模的多种存储介质结合而成的虚拟存储池。存储虚拟化GDSS(Glob
  随着市场的全球化,现代企业的发展,复杂信息系统的建立对于企业的日常业务运作、决策等都是至关重要。由于复杂信息系统要求完成的功能多而强,从而也大大增加了其开发过程中
模式,本质上即是抽象:它对具体问题、环境、最优解决方案进行抽象总结,提炼出公共要素,在更高一个层次再现。它体现了一种抽象的重用思想——设计和架构的重用,形成了一个完整的、
  数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在现实世界中,很多数据均是
运营商业务网络的整合与开放、服务提供商构建高效的企业级综合增值业务系统以及移动终端应用的良好可移植性都是亟待关注和解决的关键技术问题。本文围绕上述三方面问题进行
随着Intenet应用的快速发展,高性能核心路由器已经成为当前网络领域研究的热点和重点.而基于多协议标签交换技术的虚拟专用网系统又是核心路由器的一个重要组成部分.通过该系