论文部分内容阅读
语言是人类进行交流的重要手段,让机器听懂人类的语言,与人类进行自然的人机对话一直是人类的梦想。近年来语音识别技术的研究取得了很大的进展,基于语音识别技术的智能化设备将逐渐走入我们的工作与生活。
目前,在模式识别领域,语音识别技术已经逐步走向实用化阶段。实验室中的大词汇量的连续语音识别技术的研究已经达到了的很高的水平,但是由于嵌入式处理器的资源与速度方面的限制,其嵌入式实现还不是很成熟。而中小词汇量的孤立词识别算法相对简单,且识别率已经可以满足人们的要求,其嵌入式应用正在逐步发展起来。DSP(数字信号处理器)具有在一个周期内完成乘加运算、一个周期内多次访问存储器以及丰富的片上外设等特点,采用DSP进行语音信号处理代表未来语音信号处理的发展方向。在这种情况下,本文设计并实现了一种基于DSP的嵌入式语音识别系统。
本文在第二章对语音识别的原理进行了概括性的论述,并对语音识别常用的算法进行了比较;接下来的第三章对语音信号进行了包括预加重、分帧、加窗等预处理工作,然后通过对各种特征向量的比较,提取了Mel频率倒谱系数,将其作为语音的特征参数,并建立了训练样本库;第四章依据前面建立的样本库进行模板训练和识别,通过对动态时间规整算法的缺点进行分析,本文采用了一种改进的训练方法和改进的DTW匹配方法进行训练和识别,解决了传统DTW算法对端点检测精度过于依赖的问题,基本满足了语音识别的嵌入式应用的要求。第五章详细讲述了系统的硬件和软件设计过程。第六章为本文的总结与展望,这一章对本文所作的工作进行了总结,并分析了系统存在的缺点和不足,针对这些缺点和不足给出了今后还要进行的一些工作。最后对语音识别的嵌入式应用进行展望。
本文所识别的对象为长春市的20个街道名称,首先在MATLAB中采用上述方法进行算法的仿真实验,平均识别率为85.4%。然后在CCS下将算法进行C语言改写并加载到DSP开发板上运行。硬件系统采用的是自行开发的基于TMS320VC5402的开发板,在DSP中的平均识别率为84%,通过对实验数据的分析,取得了较为满意的实验结果,在一定程度上解决了语音识别的嵌入式应用问题。但还存在很多不足:识别率不是很高;系统鲁棒性不是很好;DSP中C语言没有进行优化,代码效率不高。因此本课题还要做很多后续工作。