论文部分内容阅读
语音识别技术是让计算机理解人类的语言,那么就意味着它将按照相应的命令执行,实现人性化的服务为宗旨。随着当代电子信息技术的迅速发展,语音识别技术利用的领域更广阔。对于在汽车智能化控制和服务中就能够体现出其价值。当小车在行进当中,语音识别系统可以对驾驶员说出的目标命令进行识别,解放驾驶人的各种与驾驶无直接关联的操作,以便集中注意力,这样不仅可以方便驾驶员,还可以大大提高了行车安全。 本论文工作是通过对汉语孤立词语音信号的特征参数和识别模型的选择仿真研究的基础上,采取Samsung S3C2440为孤立词语音识别系统的微处理器,Linux作为完成嵌入式语音识别的嵌入式操作系统,Qtopia2.2.0作为设计系统的人机交互界面的图形化系统。 本文首先概述了语音信号处理的基本理论,包括语音识别系统概述;语音信号的前端处理模块,其中模块又包含语音信号的采样和量化,预处理,分帧加窗,语音信号的端点检测;语音信号的特征提取模块,其中的提取的特征又包括线性预测倒谱系数LPCC,美尔倒谱系数MFCC;矢量量化模块,该模块介绍了矢量量化的原理,失真测度,及设计孤立词码书的LBG算法;语音识别参考模板的建模方法模块,包括偶然模板训练方法,平均模板训练方法;采用BP模型前的数据处理模块;最后是介绍语音识别模型方法:包括孤立词识别中最经典的,也是最基本的动态时间规整算法(DTW)和近年来使用比较广泛的人工神经网络(BP)算法。 本系统针对语音信号通过仿真实验分析了特征参数、识别模型的选择等相关内容,选用DTW识别机作为系统识别的模式匹配方式,梅尔频率倒谱系数MFCC作为识别的参数,在嵌入式平台的需求的基础之上,针对到嵌入式系统资源限制和实时性的要求,采用文本形式直接读取识别的参考模板,提高识别的速度。其次,要能让显示的测试结果更加直观,本论文选用的是Qtopia图形化的系统,可用于QT平台编写语音识别应用程序代码并迁移到目标板,搭建了基于ARM平台的语音识别系统,方便了操作,其中建立交叉编译环境,移植了Uboot,linux操作系统的的移植,根文件系统的制作。最后,通过对整个系统的测试,所设计的系统实现了智能和人机交互的目标,并对系统的识别性能进行了测试。 使用嵌入式系统作为孤立词语音识别平台,使用方便,适合应用于不同场所。本论文最后总结了论文的工作,指出了本文的所用方法的一些局限性。