论文部分内容阅读
语音信号处理技术发展一个多世纪以来,噪声问题一直是最普遍的威胁。近十年,由于应用前景诱人的语音识别系统受挫于噪声问题而无法在实际应用中推广,更给噪声相关课题带来新的挑战。解决噪声对信号处理系统的影响主要可以通过两条途径,其一是以噪声为中心,围绕噪声的补偿和消除来开展研究,其二是以处理系统本身为对象,通过研究系统本身对噪声的抵抗力和免疫力从而设计稳健性更好的系统。噪声特性可得的情况下,谱减法、并行模型合并法等遵循第一条思路的方法非常有效。而语音识别中Missing Data等采用第二条思路的方法因其不针对具体噪声,从而适用范围更广泛,具有更好的兼容性。本文采用了第二条思路,通过研究求和系统在噪声中的稳健性表现,提出了可广泛应用于含求和表达式的系统的稳健性加权方法。其核心理论在于:当求和系统的各分量受到相对程度不等的噪声影响时,可以通过加权的方式使系统整体的噪声敏感度降低,各分量的权重则可由该分量在噪声中表现出的局部稳健性来确定。据此,我们分别在最坏意义和统计平均意义下分析系统整体的失真,抽象出相应的数学命题,并给出证明。本文分别将该理论用于三个不同的具体应用。引入该方法可使谐波重构系统在白噪声中平均重构距离降低10%,将改进后的重构系统用于语音识别前端则在人群噪声下可获得45.9%的相对误识率下降,若不考虑基音提取错误则这一改善达73.6%。其次,我们将该理论用于抗噪识别的模型补偿,在Aurora 2实验中,以平均误识率为比较参数,新算法比基线改善了39.6%;地铁噪声下的多方法结合实验显示引入稳健性加权可在谱减法基础上获得35.7%的进一步改善,在Missing Data方法基础上获得10.9%的进一步改善。最后,我们搭建了一套便携式设备上使用的普通话短语识别系统,并应用了运算量很小的稳健性加权算法。严重失配的实际应用环境实验中该方法获得了15.2%的相对误识率下降。进一步的多方法结合实验显示该方法可在3-best系统基础上获得26.2%的相对误识率下降。