论文部分内容阅读
语音识别是一种最为理想的人机通信方式,随着计算机技术的进步,语音识别技术已经逐渐应用于控制、通信、消费等行业。语音识别既是理论问题,也是一个工程化问题。它综合多学科的理论成果,如声学、语音学、语言学、生理学、数字信号处理、信息工程、计算机科学、模式识别、人工智能等。语音识别技术发展到今天,已经可以满足通常的应用。但是语音识别系统在商品化的进程中还存在诸如识别速度(实时性)、系统的鲁棒性以及更高的识别率等具体问题。如何提高语音识别系统这些性能,使系统更快、更稳定的工作是目前研究的重点。怎样让语音识别推向更广泛的实用领域是目前语音识别技术研究的热点。本文就是在这种情况下对非特定人孤立词语音识别系统做了一些探讨。论文中首先介绍了研究课题的背景和意义。着重从语音识别技术发展的现状和目前语音识别技术面临的挑战两个方面进行了叙述。从而说明了此课题的研究方向。其次,论文介绍了孤立词语音识别系统的基本理论,分析了孤立词语音识别的基本工作过程。接着介绍了常用的特征参数,孤立词识别算法。并对其进行比较分析,然后根据本系统的特点选用了以(美尔频率倒谱)MFCC为特征参数,采用经典的动态时间规整(DTW)识别算法进行模板匹配,以提高识别率。提出了去噪声的短时能量端点检测方法,并用MATLAB7.1进行了仿真。硬件设计方面,在介绍TI公司的TMS320C6713 DSP芯片的基础上,阐述了以TMS320C6713 DSP为处理中心的孤立词语音识别系统的构成,给出了各部分的具体硬件设计。硬件系统主要由四个大模块组成:DSP模块、语音采集与处理模块、外扩存储器模块(SDRAM、FLASH ROM和SD卡)、电源模块和单片机控制模块。软件设计方面,针对孤立词识别的特点,论述了系统软件的设计过程。软件设计主要包括以下几个方面:语音信号的预处理、端点检测、特征提取、建立语音模板库、模式匹配等。在软件设计过程中还给出了语音识别各部分的流程图,并对各部分用MATLAB7.1进行了仿真,给出了仿真结果;论述了外挂FLASH的TMS320C6713引导装载程序的设计过程。通过软件系统调试,本语音识别系统具有较高的识别率。