面向服务机器人的非特定人语音识别研究及实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lfw_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“中国制造2025”的提出以及人工智能技术的发展,越来越多的服务机器人进入人们的生活和日常生产中,扮演着极其重要的角色。在服务机器人相关的技术中,语音识别技术也成为重要的关键技术之一。近年来,深度学习被应用到语音识别技术中成为当前研究热点。本文面向语音控制的服务机器人应用,首先对语音降噪方法进行了研究与改进,其次对基于连结时序分类的端到端语音识别模型展开深入研究和改进,最后构建并实现了一个语音控制的服务机器人系统,并在真实语音环境下验证了系统的可行性和实用性。首先,在真实语音环境中,信噪比会下降,因此传统的谱减法和维纳滤波法的降噪效果会变差,导致出现噪声残留及语音失真的问题,本文提出了一种基于自编码生成对抗网络的语音降噪方法,该方法将真实带噪语音通过该网络中的生成器,利用该网络中的判别器和生成器相互协助,直至生成器生成出去噪语音。实验结果表明,本文提出的基于自编码生成对抗网络的语音降噪方法能够有效提高真实语音环境下的性能,生成出的去噪语音具有更好的语音质量和可懂度。其次,选择深度卷积神经网络模型(Deep Convolutional Neural Networks,DCNN)作为研究对象,该模型以堆叠CNN为主,随着网络层数的增加,模型会发生梯度消失和网络性能的退化问题。针对以上问题,本文提出一种改进的残差双向循环网络模型(Residual Networks-Bidirectional Long Short Term Memory,Res Net-BLSTM),该模型将语谱图特征作为输入,引入残差网络和双向循环神经网络,使得模型能够学习语音的上下文信息。实验结果表明,该模型在中文实验中与DCNN模型比较,词错率降低2.52%,且系统泛化能力更强,鲁棒性更好。最后,本文在Jetson Nano上搭建了一个实际的语音控制服务机器人系统,并在真实语音环境中,测试服务机器人完成相应语音指令的识别率,证明了该系统的可行性和实用性。
其他文献
目的:研究Fas,Bcl-2抗原在Graves病(GD)和桥本氏病(HD)的表达,探讨细胞调亡在自身免疫性甲状腺病(AITD)发病中的作用。方法:粗针穿刺获得病人甲状腺组织标本,颈部手术时取正常甲状腺组
运用视觉思维的设计方法进行广告设计创意,不仅仅增强了广告作品的视觉冲击力,更增加了广告的宣传效果,可以让观看过广告的人过目不忘。通过视觉思维的设计方法进行创意的广告作
高等师范院校的音乐教育担负着为中、小学培养素质全面的合格教师的重任,但随着时代的发展,高等师范院校音乐专业的课程设置和教育理念已不能适应社会和学生从业的要求,必须进行
10月15日,在交通运输部部长李小鹏和希腊海运与岛屿政策部部长库维利斯的共同见证下,中国海事局局长许如清与希腊海岸警卫队中将STAMATIOS RAPTIS签署了《中华人民共和国海事
一、前言100多年前,号称"永不沉没"的豪华邮轮"泰坦尼克"(TITANIC)号首航便沉没于冰冷的北大西洋海底。这一震惊世界的海难事故促使人们对于海上航行安全进行了更多的思考,并催生了
<正>部海事局六方面部署下阶段海事"三化"建设重点任务9月28日,部海事局在福建厦门组织召开全国海事系统"三化"建设现场推进会。部海事局党组书记、局长许如清作工作报告,总
随着经济的快速发展和经济体制的不断改革,物流业逐渐成为国民经济中不可替代的一部分,而在整个物流产业中至关重要的部分当属铁路物流。目前,为确保铁路货运改革不断深入推
本文介绍了传统液压与气压传动技术课程的重要性以及传统课堂教学模式存在的不足,在此基础上提出了液压与气压传动课程课堂教学模式改革必要性并结合我校实际的情况阐述了关于
高职高专“对口生”是一个特殊的群体,但在教育实践中对他们的英语教育研究却几乎是空白。根据他们的特点,研究并总结针对“对口生”的英语教学方法,对于提高高职高专院校整体教
近日,IM0秘书长林基泽在致欧洲议会主席Martin Schulz、欧盟委员会主席Donald Tusk以及欧盟理事会主席Jean—Claude Juncker的信中表示,尽管欧盟在解决碳排放问题的政策上雄心