论文部分内容阅读
语音识别是让机器“听懂”人类语音,并做出正确反应,其终极目标是实现人类与机器的自然交流。随着科学技术的发展,语音识别技术正逐步形成一套比较完整的理论体系,其实用产品也相继推出,但由于各个领域需求不同,往往需要进行针对性开发。语音识别技术发展的两个重要方向是基于PC机的大词汇量识别和嵌入式的语音识别,都有广阔的市场前景。为此,对语音识别关键技术进行研究,提出一种新的识别算法——遗传动态时间规划算法(GA_DTW),与传统的动态时间规整算法相比,新算法具有较优的全局搜索能力和并行计算的特点,实验结果证明了该算法的有效性,孤立词的识别率达到95.07%;根据GA_DTW算法,设计了基于嵌入式的小型语音识别系统,将新算法运用于该系统,系统测试取得了良好的结果。其主要研究工作如下:(1)分析语音识别的基础理论,包括语音的基本组成、汉语语音特性、数字模型、语音信号采样、预加重、加窗、分帧、端点检测以及特征参数提取;针对语音预处理中最重要的端点检测,提出一种改进型端点检测算法——双动态语音端点检测算法,实验表明该算法具有更好的检测性能;在分析线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)的特点后,选用MFCC作为研究的特征参数,并提取了该参数。(2)研究目前三种主流的语音识别算法:动态时间规整(DTW)、隐马尔科夫模型(HMM)和人工神经网络(ANN)。分析它们的原理、特点及实现过程,对DTW的语音识别进行实验,通过对比分析三种算法的特点,结合本文研究的实际情况,选择DTW作为研究的重点,提出利用遗传算法对其进行改进。(3)在分析遗传算法的基础上,利用其优越的全局搜索能力和并行计算的特点,对传统的DTW算法进行改进,提出遗传动态时间规划的识别算法;重点研究该算法的实现机理、编码方式、适应度函数设计、种群初始化、选择机理、交叉运算、变异操作和终止策略,并进行实验验证,实验结果表明了该算法的有效性和高效性。(4)基于GA_DTW算法,设计了一个以SPCE061A单片机为核心的小型嵌入式语音识别系统,从硬件设计和软件设计两方面进行分析,用C语言实现了GA_DTW算法,进行了系统测试,测试结果良好。