论文部分内容阅读
近年来,随着语音识别技术的发展,基于嵌入式系统的语音识别系统广泛应用到智能玩具、工业控制、医疗服务等领域,为人们的生活带来便捷的服务。由于嵌入系统在成本、体积、功耗方面的优势,在嵌入式平台上实现高效的语音识别系统已经成为研究的热点。在基于DSP嵌入式平台的非特定人孤立词语音识别系统方面,为了推出简单适用的语音识别系统,还需要做更深入的研究。本文研究了基于DSP和DHMM的嵌入式语音识别系统的系统设计,并最终实现了一个非特定人孤立词语音识别系统。主要工作如下:首先,对于语音识别系统的原理以及涉及到的关键技术进行了研究。从语音信号的预处理分析开始,逐步分析了语音信号端点检测、特征提取以及矢量量化的原理与技术实现;并且概述了语音识别中典型的模板匹配算法的优缺点。其次,本文介绍了隐马尔科夫模型的基本原理与三个基本问题。本文通过分析各类隐马尔可夫模型的特点,选择了离散隐马尔可夫模型作为孤立词语音识别的匹配算法。本文研究了离散隐马尔可夫模型在模型训练中的定标、多观察序列参数重估算法以及观察符号概率分布矩阵的处理等问题。同时,通过定义孤立词的学习功能,解决了个别孤立词识别率不高的问题。再次,本文以DSP处理器TMS320VC5509A为核心硬件部件,构建了嵌入式语音识别系统的硬件平台。通过研究与分析系统硬件平台资源的局限与基于DHMM的语音识别系统的特点,将系统的软件架构设计为嵌入式系统软件与PC机辅助软件两部分;并且选取USB作为两个软件系统数据通信的方式。嵌入式系统软件主要完成语音识别功能,同时辅助完成简单的训练与学习功能。PC机辅助软件主要完成最佳码本训练、语音模板的训练与学习以及数据更新等功能。本文详细介绍了这两部分软件各个模块的设计与实现。最后,本文研究了嵌入式系统软件的优化。通过研究软件算法定点化与系统存储空间的优化,系统的实时响应速度从约10秒降低到平均230毫秒。通过对Viterbi算法的优化,系统实时性能再次提高36.4%,完成识别平均用时157.4毫秒。同时,系统在词汇量为100以内可以达到90%的识别率。