论文部分内容阅读
当前语音识别技术已经发展到了一个在实验室环境下相当高的水平,但是在实际应用环境中仍然存在多种问题。在实际应用环境下,不同传输信道之间的物理特性差异、环境加性噪音、说话人之间差异的影响等三方面问题是目前语音识别系统鲁棒性问题研究重点。考虑到语音检测技术在实际应用中的重要性和新兴的语音识别阵列技术,本文在语音端点检测、单通道环境噪音抗噪技术、多通道阵列环境噪音抗噪技术、消除说话人之间的差异性进行了研究。主要研究内容及结果如下:
⑴在语音端点检测方面,在深入研究现代信号处理研究成果基础上,提出一种基于积分高阶谱的端点检测特征提取算法,并建立了相应的搜索机制,另一方面在分析积分谱的缺失高阶谱相位和信息冗余的不足下,提出一种基于全谱空间的非平儿谱点组合的端点检测算法,实验验证了该方法的有效性。
⑵在单通道环境噪音抗噪技术研究方面,分析了目前广泛使用的两步维纳滤波算法,针对该算法对于信号深度衰减易造成语音信息的丢失等问题,提出了语音损失补偿的自适应算法,提高了系统的性能。
⑶在多通道环境噪音抗噪技术研究方面,在改进阵列物理尺度过大,需要预知目标信号方位信息等不足的基础上,提出一种双麦克风阵列的多通道抗噪算法,利用高阶累计量实现对于目标信号的自动定位,采用双固定增益模式的自适应组合实现对噪音方位信号的零增益,建立了声源跟踪模块、自适应零点成型模块和后处理滤波模块的系统框架,相关实验验证了方法的有效性。
⑷在消除说话人声道物理特性的研究方面,在前人研究的基础上提出一种基于先验知识的分层计算的快速归一化因子选取方法,使得在性能基本不变的条件下提高了归一化因子的选取速度。