论文部分内容阅读
语音是人和人之间进行情感交流和信息传递最直接的一种方式。随着计算机和通信技术的飞速发展,人们希望摆脱键盘鼠标的束缚,直接与机器进行交流,达到人机交互的目的,语音识别技术的研究越来越受到大家的关注,也取得了不少成果。但在实际应用场合,由于各种噪声的干扰,语音识别系统的性能会受到严重影响,导致识别率大幅度降低,所以噪声环境下的语音识别研究成为关注的热点和难点。本文从语音识别的前端处理部分着手,重点针对语音增强技术,对语音增强的相关算法进行了研究和实现,其主要内容和成果如下:
第一,分析了语音识别抗噪技术研究中存在的一些问题,通过现有抗噪方法的对比指出语音增强适合作为预处理手段直接应用于语音识别前端处理部分,并对语音增强的相关知识和常用语音增强算法进行了分类介绍,重点对谱减法和维纳滤波法进行详细描述。
第二,针对谱减法对噪声估计不准确,造成残留“音乐噪声”,影响语音质量的问题,提出基于噪声短时谱动态估计的改进方法。采用噪声平滑公式更加及时准确地估计噪声谱,引入过减系数控制谱减幅度,并根据反映噪声变化趋势的惯性量来动态调整过减系数。通过仿真实验和语音质量评价方法,证明该改进算法能够有效去除残留噪声,达到更好的增强效果。
第三,在维纳滤波法推广形式的基础上,结合人耳听觉掩蔽效应,建立了基于听觉掩蔽效应的两级维纳滤波模型,通过一级滤波增强后语音与纯净语音之间的误差与听觉掩蔽阈值进行比较,对相应参数进行调整,再进行二级滤波,得到最终的增强语音。仿真实验结果和语音质量的主观、客观评判表明,该改进算法在有效提高信噪比的同时减少了对纯净语音的破坏,保证了增强语音的质量。
第四,设计并实现了基于语音增强抗噪处理技术的孤立词语音识别系统,对系统硬件平台和软件方案的设计及实现过程进行了详细介绍。并且构建了专用的语音库对系统进行测试,验证了本文提出的改进算法能够有效抑制汽车噪声干扰,提高系统的识别率。