说话人识别中语音特征参数提取方法的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xudatui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了应用于说话人识别系统的语音特征提取技术。针对加性噪声环境中的语音增强和端点检测、基音特征提取、听觉特征参数提取及降维等方面进行了深入的研究与探讨。论文的主要研究内容如下:1.提出了一种基于扩展谱相减的语音增强算法,使得对背景噪声的估计相对传统方法更加精确。结合语音缺失概率和动态阈值法提出了一种新的端点检测算法。实验证明该算法在低信噪比条件下也能准确检测出语音起始点。2.提出了一种基于CAMDF的倒数加权自相关来进行基音周期估计方法,即RCAF(Reverse CAMDF Autocorrelation Function)算法。仿真实验结果表明,RCAF算法能够减少由共振峰和噪声所引起的异变点对搜索峰值的影响,从而精确地提取基音周期,相对于传统算法具有更强的抗噪声性能。3.对人耳听觉模型进行了深入研究,采用Gammatone和Gammachirp这两种滤波器来建立耳蜗工作模型并设计其数字滤波器的实现方法。该组滤波器与人耳听阈曲线拟合度高,具有良好的模拟人耳听觉的特性。4.提出了两种基于人耳听觉特性的语音特征参数:Gammatone滤波器系数(GTF)与Gammachirp滤波器系数(GCF),在与文本无关的说话人辨认实验中,取得了优于传统特征参数的性能。针对听觉特征维数较高难以应用的问题,探讨了基于主成分分析和离散余弦变换的特征降维方法,给出了基于PCA降维的说话人识别算法,通过离散余弦变换得到了听觉倒谱特征。在纯净语音和带噪语音情况下分别进行仿真实验,结果表明经过降维后的听觉特征仍然具有良好的噪声鲁棒性,在噪声条件下仍然获得了最优的识别率。
其他文献
在当前课程改革进入新常态阶段,现代教育理念和教育信息技术获得了较为长足的发展,其对传统教育带来了巨大的冲击,有力推动了教育领域内的多种变革,与此同时知识模式和知识需
:动机、兴趣是深刻影响外语学习的二大情感智力因素。本文从心理学角度探讨了二者对外语学习的影响并提出几点应对的教学策略。把握学习者情感因素与外语教学的内在联系 ,选
本文主要从迪伊的内心斗争、迪伊和麦吉的斗争、迪伊和她的妈妈之间的斗争三个角度分析艾丽斯·沃克尔《外婆的日用家当》中的迪伊的内心斗争。
偶像崇拜,尤其是明星偶像崇拜,是大学生中的普遍现象。从20世纪60年代到今天,不同时代的大学生有着不同的偶像,偶像的变化折射出巨大的时代变迁。大学生偶像崇拜,一方面有自
<正>去年以来,有幸参加了两期由省委宣传部举办的全省新闻战线马克思主义新闻观培训班的学习,聆听了专家学者对马克思主义新闻观、习近平新闻舆论重要思想、融媒体大数据时代
外贸英文信函不同于其他文体,有三个显著的语言特点:礼貌(courtesy)、简洁(conciseness)和明了(clearness)。笔者通过实例分析探讨了外贸信函英译的简洁明了原则。
高山植物长花马先蒿在第四纪发生过大范围的迁移扩张事件,物种迁移路线和方向至今还不是很清楚.根据长花马先蒿叶绿体基因变异的单倍型空间分布格局,基于物种分布模型MXENT和
<正>一、来宾市政府非税收入收缴管理改革工作情况(一)基本情况。按照《财政部关于加强政府非税收入管理的通知》(财综[2004]53号),政府非税收入,是指各级国家机关、事业单位
<正>一、创业板IPO过程中会计政策的选择与盈余管理(一)背景分析。我国的创业板市场对于公司的成长性有着较高的要求,这就给很多公司在对企业的营业收入方面造成了盈余管理的
在已有的广义反对称矩阵相关的性质定理的基础上,推出了几个新的性质定理,使其全面和完善.