面向语音识别的抗噪听觉特征提取及优化

来源 :太原理工大学 | 被引量 : 6次 | 上传用户:mllx03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为语言的物质外壳和声学表现,是人类最容易获取信息的载体之一,它承载和传达着多方面的信息源,是人机交互和智能通信领域的研究内容之一。语音识别作为具有广阔应用前景和价值的实现智能人机交互的技术之一,主要是达到与计算机进行语音交流的目的。最终让计算机能够将输入的语音信号转变成听得懂的命令。而完整的语音识别系统包含特征提取和模式识别两大模块。其中特征提取作为语音识别的重要组成部分,对系统性能的优劣有较大影响。理想的特征参数应该在复杂环境下都具有较高的稳健性和鲁棒性,而如何从语音信号中提取到能够充分表征其语义信息、削弱说话人个性、易分类且具有稳定性的有效特征参数,进一步提高识别率是语音识别的关键。本文从语音识别的研究现状和背景意义出发,在前人的研究基础上,详细介绍了语音识别和语音特征参数的研究动态,并针对当前语音特征参数中表征语义信息的不完整性,以及在噪声环境下识别性能下降的问题进行研究,从特征提取、特征融合和特征优化三个方面入手,对语音识别系统的不同环节进行深入研究和实验验证。论文的主要研究工作如下:(1)概述了语音识别系统的组成。首先对语音信号的三大数字模型进行介绍,其次,详细阐述了语音识别的基本原理、分类以及系统的性能评价指标;然后针对语音识别系统的三大模块进行详细阐述:语音信号的预处理过程及其操作细节、常见特征参数的提取过程和语音识别分类模型。最后对语音识别技术进行总结。(2)以听觉特征耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)的提取过程为基础,结合瞬时频率信息提取了CFCCIF特征,并采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数(New Cochlear Filter Cepstral Coefficients,NCFCC),探讨了不同的非线性变换过程对CFCC特征性能的影响,对NCFCC特征在同一语音库不同信噪比环境下的不同识别效果对其鲁棒性能进行了有效验证。(3)针对语音识别系统在噪声环境下性能下降的问题,基于上述NCFCC特征,在语音信号前端处理中应用增强技术,即将语音增强与特征提取相结合,采用不同的语音增强方法应用于特征提取前端,提出了三种新的鲁棒特征参数,分别是:基于非线性幂函数和谱减法的融合特征(Fusion Feature based on Power-law nonlinearity function and Spectral Subtraction,FFPSS)、基于非线性幂函数和递归最小二乘法的融合特征(Fusion Feature based on Power-law nonlinearity function and Recursive Least Square,FFPRLS)和基于非线性幂函数和最小均方法的融合特征(Fusion Feature based on Power-law nonlinearity function and Least Mean Square,FFPLMS)。验证了语音增强和特征提取相结合的有效性,进而证明基于上述三种特征的语音识别系统的识别率均有所提高。(4)从语音增强的角度出发,分析含噪语音的能量跟踪变换特性,进而提取Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC),针对单一类型特征不足以表征语音信号的完整特性,首先设计实验验证动静态组合特征对单一静态特征的优化作用,然后结合能量特征TEOCC形成融合特征集,验证了能量特征TEOCC可以对人耳听觉倒谱特征起到特征补偿的作用,进而证实了融合特征集能够有效地提高识别网络的鲁棒性能。(5)针对上述融合特征集存在的数据量大和计算复杂度较高的问题,提出了基于主成分分析的特征优化方法。首先设计基于动静态组合特征优化预实验对该方法的可行性进行了验证,然后对加入能量特征的融合特征集进行特征优化识别对比实验,得到优化后的语音特征参数集合,最后针对优化特征集合设计识别对比实验,获得最优特征集合,进而验证了该特征集能进一步提高语音识别系统的识别性能,并证实了特征优化方法的有效性。
其他文献
目的通过对中药饮片的处方分析,提高饮片调剂质量。方法以传统中医药理论、《中华人民共和国药典》和《中药处方格式及书写规范》为指导,采用列表分析的方法,分析和讨论选取
<正>在洛桑以东约200公里的瑞士南部阿尔卑斯山区里,洛伊克巴德(Leukerbad)是古罗马人发现的著名深山温泉胜地。海拔2000米以上的温泉疗养地,是阿尔卑斯山最大的高山浴场中心
试验以紫甘薯为原料,运用超声波辅助提取法提取花色苷,采用响应面试验设计研究提取温度、时间、功率等复合因素对花色苷提取效果的影响,确定了最佳提取工艺参数。结果表明:曲
在农民工权益表达多元化的背景下,何种机制影响他们的权益表达选择构成了本研究的核心问题。在以政治信任为中介变量的农民工获得感与其权益表达倾向选择的分析框架下,本研究
用甲醇提取配合饲料中的氯米芬,提取液通过MCX小柱进行富集、净化,通过高效液相色谱仪进行检测,利用紫外检测器定量及二极管阵列检测器进行定性。实验表明,顺反式氯米芬分离
建立并完善法律顾问制度是我国司法制度改革的重要内容,是建设法治政府的必然要求,是全面推进依法治国的重要举措。党的十八届四中全会指出:“积极推行政府法律顾问制度,建立
近年来,我国大部分油气田企业先后提出了一体化管理的思路,将上市和存续业务放在同一平台上谋划发展。一体化管理有利于消除企业内部上市与存续发展不平衡的弊端和矛盾,有利
杜仲隶属于杜仲科,单属单种,是一种能替代天然橡胶的胶源植物。由于它的落叶数量巨大,收集容易,成本低廉,且可再生,作为提取杜仲胶的生产原料最为切实可行。通过选育多倍体品
会议
理想信念是大学生精神上的"钙",加强医学生理想信念教育对我国医疗卫生事业的发展有重要意义。通过对医学院校学生理想信念的现状调查分析,显示大部分医学生理想信念是积极的、
随着社会生产力的发展,富裕家庭的留守儿童已经成为一种新形势下的新型留守儿童,父母试图用金钱来弥补对子女关爱的缺失,导致他们的社会自我发展不健全。在中国一些城市还呈