车载噪声环境下的语音命令词识别的仿真研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xjjxffxxff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于语音的命令控制功能可以让驾驶者更加自然地控制车载电子设备,也能减少驾驶者因操作车载电子设备而分神,从而极大地提高行车的安全性。由于语音命令词的识别需要持续运行,为了减小对资源的消耗以及考虑到车辆运行时可能出现网络状态不佳甚至无网络的情况,研究搭建一个可离线使用、资源要求小、识别率高、噪声鲁棒的命令词识别模型具有重要的应用价值。为此,本文进行了如下的研究工作:一、研究了无噪环境下的命令词识别。考虑到CNN善于局部建模、RNN善于序列建模,提出一种同时含有卷积和循环两种操作的神经网络结构CGRU,据此搭建命令词识别模型;实验结果表明,基于CGRU的识别模型在本文实现的7个识别模型中取得了最高的命令词识别率,为96.65%,比次佳的ResCNN模型的96.53%还高,且所需的乘法运算量仅为ResCNN模型的1/25。二、研究了基于深度学习的单声道降噪。考虑到fbank特征是命令词识别模型的输入的组成部分,且其维度一般远低于FFT频谱的维度,提出对fbank特征进行降噪;考虑到车载噪声随时间的变化比语音平缓,使用善于局部处理的CNN来处理当前帧的邻域可更好地提取出噪声信息,据此提出基于CNN-RNN的降噪模型。实验结果表明,相比于RNN降噪模型,CNN-RNN降噪模型使MSE平均降低了24%,且使参数数量、乘法运算量分别减少了62%、55%。三、研究了车载噪声环境下的命令词识别。考虑到降噪模型无法完全地消除噪声,在整合降噪模型和无噪环境下的识别模型后,重新训练识别模型可减小测试数据和训练数据的不匹配程度;对两种重新训练的方式进行了实验:1.使用随机初始化参数的方式重新训练识别模型;2.在当前模型参数值的基础上重新训练识别模型。实验结果表明,以方式2重新训练识别模型,可增强识别模型的噪声鲁棒性,在-15 dB信噪比下也能取得94.94%的识别率,且平均识别率达到了96.40%,仅比无噪时的识别率低了0.25%。
其他文献
城镇化问题是中国经济社会发展的综合性课题。鄱阳湖生态经济区城镇化应将生态环境因素纳入视野,树立与生态协调发展的理念,建立开放协调机制,优化产业布局,推进区域城镇化与
随着互联网时代到来,电子商务、网络购物进一步渗透人们的日常生活,在享受它们带来的便利同时也产生了许多不容忽视的问题。本文从网购中的五个主体,即消费者、商家、网络运
目的 :探讨对接受手术后的痔疮患者采用高效单质银抗菌凝胶联合中药熏洗法进行护理的效果。方法:将在百色市中医医院接受手术的120例痔疮患者平均分为Control组和Research组
近日,中国人民银行表示,全国摸排出的ICO平台和比特币等虚拟货币交易场所基本已实现无风险退出.可见,在严监管之下,我国对虚拟货币市场的监管取得初步成效.而在业内人士看来,
本文根据永定河生态修复过程中对河道补水水质、水量的要求,结合永定河丰台段水文地质条件,采用复合型人工湿地技术对永定河园博湖湖水进行循环水质净化,并充分发挥人工湿地
浪漫主义时期的音乐与绘画作为姊妹艺术有很多相似之处,尤其体现在审美上。文章从二者的审美标准、审美主题、审美作用和价值等方面进行阐述,从而导出艺术精神本质。 Romant
民粹主义是一种政治思想,也是一种社会运动。在自媒体时代,它借助互联网的平等性、聚集性和偏激化.释放社会民众的不满和反抗情绪,在国家政治生活中扮演着“赵孟之所贵,赵孟能贱之
神经症是精神科疾病中的一个特殊的病种,了解神经症患者的心理特征有助于临床治疗及护理,本文总结多年的临床实践经验。就神经症患者的心理特征及心理护理阐述我们的体会。
结合全国技能大赛考核标准及常规玻璃仪器使用方法,对移液管、酸碱滴定管、容量瓶的使用方法进行详细的论述。在对规范仪器使用方法和提高大赛成绩方面有所指导,同时对提高高
海底捞餐饮股份有限公司在管理上实施人性化和亲情化的管理模式:倡导双手改变命运的价值观,为员工创建公平公正的工作环境,提升员工价值,注重对企业员工的人文关怀和企业的文