论文部分内容阅读
机器人技术发展至今,智能机器人的研究开发成为现在最热门的工作之一。语音识别作为一门交叉学科正逐步成为信息技术中人机接口的关键技术,语音识别技术使人们能够甩掉键盘,通过语音命令进行操作。语音控制为人们在手动控制以外提供了一种更安全,更方便的控制方法。语音定位可以对声源进行全方位的定位,不会存在死角,广泛应用于助听装置、智能机器人、地震研究、航空航天等领域。语音识别和声源定位技术是当今智能机器人研究的热点之一。
本课题是以AS-R移动机器人为平台,开发设计了语音识别和声源定位系统。此系统不仅能使用语音控制AS-R移动机器人,使其执行相应的运动,还能根据声源辨别出移动机器人的位置,并显示到AS-R移动机器人的上位机界面上。
首先根据语音识别和声源定位原理,对移动机器人语音指令进行了采样、预滤波、分帧加窗、双门限端点检测等预处理工作;并对语音信号的时域和频域进行了分析,重点提取分析语音的特征信号、线性预测倒谱系数LPCC和Mel倒谱系数MFCC;对比分析了基于动态时间规整(DTW)和隐马尔可夫模型(HMM)模板匹配语音识别算法,最终选定对小词汇量的、特定人应用比较成熟的DTW语音识别算法,并基于局部约束和全局约束对DTW语音识别算法进行改进,使改进后的DTW语音识别算法识别率更高,更精确。
其次根据声源定位原理、对语音信号特征的放大处理和对语音信号的提取,本课题建立了基于二维三点的语音定位模型。通过分析比较声源定位的算法,最终本文选定基于时延的声源定位算法,并设计了声源定位系统。
最后基于AS-R移动机器人,本文使用Microsoft Speech SDK提供的关于语音处理的一套应用程序编程接口,设计了移动机器人语音控制系统和声源定位系统。本文还使用MATLAB对语言信号进行了特征分析和提取,并对经过改进的DTW语音识别算法和基于时延的声源定位算法进行了仿真分析,初步证明了本文所设计算法的合理性、先进性,符合本课题的要求。