论文部分内容阅读
随着语音识别技术的深入发展,在语音识别领域已经有许多成熟算法并且有了成功的应用实例。随着DSP技术的飞速发展,其系统功能、数据处理能力以及与外部设备通信功能地不断增强,采用DSP实时实现语音识别系统已经成为可能。本文介绍了以TMS320C5409 DSP为核心的小词汇量实时语音识别系统的设计与实现。由于DSP的运算速度和存储空间都是有限的,所以在DSP上实现语音识别系统,除了在硬件设计上,更多的工作在算法选择和软件编程上。文中重点介绍了系统的软件设计过程,给出了程序流程图,并对编程时的注意事项进行了说明。针对汉语数字语音及TMS320C5409 DSP的特点,系统采用常用的能量和过零率相结合的方法进行端点检测,分别采用了三种语音识别特征参数—LPC倒谱系数、Mel频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)。在语音识别的后端中选用RBF神经网络进行识别。模糊信息理论是一种基于模糊集理论的信息科学,是指导工程实践的一个有普遍意义的强有力工具。本文将模糊理论引入RBF神经网络对其进行了改进。常规RBF神经网络的隐层一般采用高斯函数,然而任意输入对于中心点的隶属程度并不总是服从高斯分布,本文用任意输入模式与各类中心的隶属度来替代原有的径向基函数的输出。实验结果表明识别率得到了提高。系统算法由C和汇编语言编写,并在TMS320C5409板上对语音识别算法进行了调试和实验。系统选用汉语数字孤立词为识别对象,识别结果通过异步通信串口送到PC上实时显示。实验结果证明了系统的有效性。