论文部分内容阅读
语音识别技术作为一门涉及声学、语音学、语言学、计算机科学、信号处理、人工智能等诸多学科的综合性技术正逐步成为信息技术中人-机接口的关键技术,有着重要的理论价值和广阔的发展前景。智能轮椅作为助老、助残服务机器人系列产品中的一个重要研究领域,把语音识别技术与智能轮椅控制技术结合起来,正成为目前研究的热点。比如:残疾人可以用简单的命令来控制智能轮椅的运动等。因此,研究实用的智能轮椅语音识别控制系统,不但具有较好的理论意义,而且有重大的实用价值。本文介绍了智能轮椅语音命令词识别控制技术的基本原理,着重研究了基于Mel频率倒谱系数(MFCC)与分形维数混合特征参数提取的隐马尔可夫模型的语音识别算法,实现了对智能轮椅的实时语音控制。在MATLAB平台上构建了一个基于隐马尔可夫模型(HMM)的非特定人、孤立词、小词汇量语音识别系统。该系统实现了语音识别的主要过程,包含预处理、端点检测、特征参数提取和模式匹配。建立了智能轮椅命令词训练样本库和测试样本库,利用隐马尔科夫模型完成了汉语语音命令词:“前进”、“后退”、“左转”、“右转”、“停止”的训练和识别。测试结果表明,该系统的识别率达到85%以上。同时,通过仿真实验分析了不同特征参数对系统性能的影响。在提取语音特征参数阶段,就语音时域波形表现出的分形特性,把语音的分形维数作为命令词识别的一个特征参数,采用一种新的语音特征提取方法,即把语音的分形维数分别引入到传统的Mel频率倒谱系数(MFCC)和线性预测倒谱系数(LPCC)所得到的混合特征参数提取算法,这样的混合特征参数更好的体现了语音的特征,提高了系统的识别率。仿真结果表明,该方法比单独使用传统的Mel频率倒谱系数(MFCC)和线性预测倒谱系数(LPCC)的语音识别方法具有更好的识别性能。针对该语音识别系统进行了智能轮椅语音命令词的控制实验,实验结果表明,该系统达到了实验室条件下语音识别控制的预期效果。本文所建立并实现的语音识别系统既可用于对智能轮椅的语音控制,又为将来要开发更复杂的基于多传感器与多信息融合的智能轮椅控制技术奠定了基础。