语音识别系统噪声鲁棒性算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wyt20070210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着语音识别技术不断地发展,语音识别系统已开始从PC机逐步走向嵌入式平台。然而当嵌入式语音识别系统应用到真实的操作环境中时,由于训练环境和识别环境的不匹配,导致其识别性能大大的下降。本文的重点是针对这些问题,对语音识别系统噪声鲁棒性算法展开研究。本研究主要内容包括:   ⑴构建了一个非特定人语音识别的仿真系统,系统采用一个简化的连续隐马尔科夫模型,即非线性分段与高斯混合模型(NLP+GMM)。该系统将用于噪声鲁棒算法的研究与测试。随后以该系统为基础,进行了谱减法(SS)和维纳滤波(WF)的语音增强实验。实验结果表明,在低信噪比情况下,两种语音增强算法都使系统对噪声的鲁棒性得到提升。   ⑵提出了求取倒谱均值方差归一(CMVN)参数的递推算法。该递推算法能在线性时间复杂度内计算出均值和方差,使得CMVN参数的平均计算速度得到显著提升。   ⑶在CMVN算法基础上,提出了基于统计阈值的CMVN,即STCMVN算法。STCMVN算法不仅能滤除特征空间的高频噪声,而且进一步减小训练环境和识别环境的不匹配。实验表明,在信噪比较低情况下,STCMVN都要优于MFCC、CMS和CMVN; CMVN与MFCC相比,相对提升率最高达到24.03%,而STCMVN与CMVN相比,相对提升率最高达到3.03%。   ⑷提出了语音增强与特征变换的两种融合算法。算法一:只将增强后的语音应用于VAD,而特征提取使用原始带噪语音;算法二:将增强后的语音既用于VAD又用于特征提取。实验表明,两种融合算法的识别结果整体上都要好于文中未融合噪声鲁棒算法的识别结果。就这两种融合算法相比较而言,在较低信噪比(SNR≤5dB)情况下,算法一的识别率高于算法二;在较高信噪比(SNR≥10dB)时,算法二的识别率高于算法一。
其他文献
随着互联网在人们生活中的重要程度越来越高,随之出现的安全性问题也愈加严重起来,其影响范围和影响程度也非常巨大,任何一个微小的漏洞或信息的泄露都有可能造成巨大的影响和破
随着网络通信与无线通信系统的快速发展,目前的视频编码技术已不能再满足人们对多媒体业务的需求,如何提出高效、快速的视频编码算法成为了学者研究的热点。H.264作为一种高
矿产开采过程中的安全事故频频发生,造成巨大的经济损失和惨重的人员伤亡。矿井安全管理迫切需要一种易于推广、成本低以及有效的监测技术,实现井下环境的实时监测功能,掌握
复杂交通环境中基于视频图像序列的多目标跟踪与识别技术是智能交通监控系统领域近年来备受关注的热点之一,其涉及的技术知识十分广泛,包括计算机视觉、图像处理与模式识别、人
无线传感器网络技术已经成为现代技术研究的热点方向之一,具有重大的科学意义和应用前景。但无线传感器网络节点往往能量和带宽有限,计算能力和存储能力弱等限制,传统的无线
故障诊断是一种通过对故障信息之间逻辑关系的分析而进行故障判断与诊断的技术。如何构建有效的故障诊断模型,以及如何消除诊断过程中不确定性问题带来的影响,是故障诊断技术研究中需要解决的关键问题。其中,对于不确定性问题的分析是一个难点,国内外研究者针对不同背景从不同角度已提出了多种分析和处理的方法。针对故障诊断过程中存在的一系列不确定性问题,尤其是故障信息影响因子的分配以及信息采集时间的不确定性问题,本文
随着移动互联网的发展,移动智能终端设备在全球范围内得到了迅速地普及。Android作为一款应用于移动智能手机上的操作系统,以其开源的特性受到了众多用户的青睐。然而,开源的代
信息物理融合系统(Cyber Physical Systems,CPS)是一种新兴技术,它代表了下一代的核心信息技术,甚至被称为“第三次信息革命”,足见其受重视程度。CPS注重的是现实世界和虚拟
无线传感器网络WSN是当前嵌入式与物联网领域的研究热点之一。WSN的应用开发涉及传感器、无线通信与组网、嵌入式软硬件设计及应用对象领域等综合技术。WSN的应用研究与产品
目前,语音端点检测已经成为语音识别,语音编码及语音分类等语音处理过程中必不可少的一部分。作为语音技术的预处理,语音端点检测(Voice Activity Detection,VAD)准确率的微小改进