论文部分内容阅读
语音识别技术在电子、通信、工业控制、计算机和信息服务等领域有着广泛的应用和光明的发展前景。未来语音交互系统将成为人机对话的普通工具,故对语音识别的深入研究,顺应了市场的要求,同时也将大大推动语音技术的发展。人与机器交流和沟通壁垒的解决与突破,将为人类提供更加方便、自然、快捷的操作界面及更友好的交互方式。 本文在分析了语音识别的研究发展现状基础上,提出了语音识别的改进算法,将矢量量化(VQ)的码本设计进行改进和优化并与最小二乘支持向量机(LSSVM)结合来共同构建VQ-LSSVM二次语音识别模型。考虑到高信噪比的纯净语音信号对语音识别系统的影响,在语音识别系统的前端引入基于麦克风声源定位的语音增强算法。具体是利用麦克风阵列的声源定位方法来锁定有效声源方位参数,然后根据参数对声源方位作可控波束指向性增强,将增强后的语音信号输入语音识别系统进行语音识别。最后将前端语音增强及后端系统模型识别算法植入TMS320C6713 DSK硬件平台进行实验仿真和验证完成系统设计。 本文的创新成果如下: (1)将搜索空间预估计的波束指向性增强算法引入到语音识别系统,用以语音增强来提高识别系统输入信号的信噪比。具体是先利用搜索空间预估计声源定位算法得到有效声源的方位参数,再由此参数对期望方向上的信号做波束指向性增强,从而最大程度抑制了干扰。该算法作为语音识别系统前端用以语音增强,具有计算量小、抗干扰能力强的优点。 (2)本文在传统已有的语音识别系统基础上,采用LBG和遗传算法(GA)相结合的码本设计,并将VQ码本设计与LSSVM模型相结合构建VQ-LSSVM语音识别系统模型。系统通过训练先得到VQ模板,再求出VQ码字与特征参数的最小失真测度,并将该测度来训练LSSVM模型,最终得到系统训练模板。识别时先用VQ模板对待测语音信号进行初次识别,对于落入设定阈值内的矢量再用LSSVM模型进行二次识别,最终得到系统识别结果。 最后,论文给出了语音识别系统在MTALAB及 DSP平台上的实验结果和系统性能分析,并对课题的工作进行了总结,指出了下一步研究工作的思路以及改进方向。