基于移动机器人的语音识别与声源定位技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:abc890619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人技术发展至今,智能机器人的研究开发成为现在最热门的工作之一。语音识别作为一门交叉学科正逐步成为信息技术中人机接口的关键技术,语音识别技术使人们能够甩掉键盘,通过语音命令进行操作。语音控制为人们在手动控制以外提供了一种更安全,更方便的控制方法。语音定位可以对声源进行全方位的定位,不会存在死角,广泛应用于助听装置、智能机器人、地震研究、航空航天等领域。语音识别和声源定位技术是当今智能机器人研究的热点之一。   本课题是以AS-R移动机器人为平台,开发设计了语音识别和声源定位系统。此系统不仅能使用语音控制AS-R移动机器人,使其执行相应的运动,还能根据声源辨别出移动机器人的位置,并显示到AS-R移动机器人的上位机界面上。   首先根据语音识别和声源定位原理,对移动机器人语音指令进行了采样、预滤波、分帧加窗、双门限端点检测等预处理工作;并对语音信号的时域和频域进行了分析,重点提取分析语音的特征信号、线性预测倒谱系数LPCC和Mel倒谱系数MFCC;对比分析了基于动态时间规整(DTW)和隐马尔可夫模型(HMM)模板匹配语音识别算法,最终选定对小词汇量的、特定人应用比较成熟的DTW语音识别算法,并基于局部约束和全局约束对DTW语音识别算法进行改进,使改进后的DTW语音识别算法识别率更高,更精确。   其次根据声源定位原理、对语音信号特征的放大处理和对语音信号的提取,本课题建立了基于二维三点的语音定位模型。通过分析比较声源定位的算法,最终本文选定基于时延的声源定位算法,并设计了声源定位系统。   最后基于AS-R移动机器人,本文使用Microsoft Speech SDK提供的关于语音处理的一套应用程序编程接口,设计了移动机器人语音控制系统和声源定位系统。本文还使用MATLAB对语言信号进行了特征分析和提取,并对经过改进的DTW语音识别算法和基于时延的声源定位算法进行了仿真分析,初步证明了本文所设计算法的合理性、先进性,符合本课题的要求。
其他文献
自动化和计算机技术的高速发展,促使很多锅炉供热控制现场已经实现了自动控制。然而在国内锅炉供热系统中,相关参数的被控效果并不理想,绝大多数系统中,操作人员仍凭借着粗放
齿轮作为机械设备中应用最广的动力传递装置,其具有的振动特性对整个机械设备的工作性能有十分重要的影响,所以对齿轮系统振动特性的研究具有重要的理论以及现实意义。本课题
近年来,随着机器人技术和图像处理技术的飞速发展,机器视觉也越来越广泛的被应用于物流系统中。自动化、柔性化、智能化的物流系统及其各组成部分的开发研究已成为一种必然的发
针对一类非线性系统,设计了将滑模控制分别与模糊控制、神经网络控制以及自适应控制相结合的控制策略,并采用微粒群算法对系统的参数进行优化设计,最后结合倒立摆模型进行仿
目前广域监控系统已被广泛地应用于社会生活的各个领域中,计算机通信技术的飞速发展使得技术人员无须亲临现场就能够监视并控制广域分布的各现场设备的运行状态及各种参数。
目标定位技术是智能机器人领域研究的热点之一。近年来机器人声测定位技术引起国内外很大的关注,而我国相对起步比较晚,国内从事这一领域研究的大学和研究机构相对较少,且将其应
表面等离子体共振现象自1902年在实验被发现以来,吸引了众多学者的研究兴趣,在理论研究和应用研究方面都获得快速发展,随着近30年微纳加工技术的突破性进展,国内外对基于表面
随着服装工业的发展和人们对服装合体性、个性化要求的提高,个性化服装定制愈来愈受到人们的关注。个性化服装定制(P-MTM)是在电子化服装定制E-MTM基础上更加强调服装的个性化
无线传感器网络是一种自组网,传感器节点能量受限,且一般部署在人际罕至的偏远区域,节点能量消耗的不均衡以及网络抗毁性差,均会缩短网络的生命期,致使网络无法完成既定的监
随着石油工业的发展,采用埋地金属输油管道进行原油输送已成为国内原油输送的一种重要方式。于是,防止管道由于腐蚀穿孔等问题而出现安全事故,就成为一项具有重大意义的工作