基于深度学习的低延迟终端命令词识别系统设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：outerwy

【摘要】

：

语音识别系统作为智能人机交互技术的重要组成部分,在各个领域都有着广泛的应用需求。连续语音识别技术一般模型复杂,计算需求量大,终端识别困难,目前主要采用联网在线识别的

【作者】

：

轩晓光

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

命令词识别语音识别长短时记忆神经网络深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别系统作为智能人机交互技术的重要组成部分,在各个领域都有着广泛的应用需求。连续语音识别技术一般模型复杂,计算需求量大,终端识别困难,目前主要采用联网在线识别的方式,成本较高,时延较大。对于一些控制类终端设备来说,十几个到几百个关键的命令词就可以覆盖所有功能,在这种场景下命令词识别比连续语音识别更加合适。但目前的命令词识别系统存在着支持的命令词个数较少、识别率不高、系统复杂、识别延迟高、功耗大等问题,为了解决这些问题,论文设计了一种新型的基于深度学习的低延迟终端命令词识别系统,并完成了终端硬件平台的实现。针对命令词识别特征需要精简准确表达语音信息的问题,采用梅尔滤波器组输出特征作为识别系统的输入特征。论文详细分析了语音信号处理的过程以及深度学习网络输入特征的要求,通过将频率经过非线性映射到梅尔域构建的滤波器组对语音功率谱进行滤波操作,尽量的保留了低频有用信息,减少了高频冗余信息。实验证明该特征很好的表达了命令词的内容信息,同时降低了识别网络的计算量。针对命令词识别需要拟合音频帧与拼音标签关系的问题,采用长短时记忆(Long Short-Term Memory,LSTM)循环神经网络来对问题进行建模。论文详细的分析了深度前馈神经网络结构、卷积神经网络结构和循环神经网络结构,通过利用LSTM循环神经网络中的非线性激活函数、门控结构产生的历史状态以及网络的时间维度参数共享机制,提高了模型对于复杂语音分布的拟合能力,满足了可变长序列的处理需求,使模型可以随语音的录入逐帧处理以降低延迟。实验仿真结果表明模型对于测试集的识别有着很高的准确率,在硬件平台上的实验结果表明模型的识别延迟也非常低。针对深度学习识别模型输出的概率图转化识别结果的问题,提出了一种最大概率匹配置信度算法。算法利用概率图中的信息将每个词在这段语音中可能出现的最大概率计算出来,经过对比选择最大值对应的命令词作为结果,可以通过设置阈值与最大值对比来平衡准确率和误识率。该算法能够在对目标命令词进行准确识别的同时,很好的降低其它语音输入被错误识别为目标命令词的概率。为了验证设计好的命令词语音识别系统实际应用性能,论文结合STM32F407终端硬件平台设计了命令词识别系统的整体框图,针对终端硬件平台的特点对设计好的算法模块进行加速优化实现,并对部署到终端硬件平台的各个算法模块分别进行验证。验证结果表明系统可以在低计算资源的终端硬件平台上完整的运行。另外论文还对终端硬件平台录制的数据进行了测试实验,实验证明,基于深度学习的终端命令词识别系统在实际应用场景中有着很高的识别率和很低的延迟。

其他文献

社区药学服务的调查心得

<正>随着社会的发展,用药安全越来越引起人们的注意,特别是社区居民用药存在不少问题,通过在社区开展药学服务工作,扩大了药品管理有关法规的宣传效果,普及了用药知识,提高了

期刊

社区药学服务社区医护人员用药水平不良反应社区居民用药安全多种药物

浅谈高中语文课堂的育人功能

语文课堂内容既是智育目标又是德育因素，应该着眼于心智健全的公民人格的培养。素质教育重在教书育人，当前高中语文课堂注重语文工具性知识传授，忽视了语文课程的人文性。针对这

期刊

高中语文语文课堂育人功能

鄂伦春族桦树皮制品图案艺术与文化内涵

鄂伦春族是桦树皮文化最发达的民族之一，主要体现在日常生活、生产的各个方面。在桦树皮制品完成后，鄂伦春人通常用一些图案装饰，如几何纹、植物纹、动物纹等。这些图案将写实与

期刊

鄂伦春族桦树皮文化图案艺术

广东欠发达县域金融发展与经济增长关系研究

作为连接城镇与农村的枢纽,县域经济的发展是实现全面小康,推进新型城镇化、解决“三农”问题的着力点。2015年,中国政府又对经济结构调整首次提出了供给侧结构性改革理念,作

学位

欠发达县域粤北山区经济增长金融发展

就寿司论日本饮食文化特征

日本传统的饮食体系中,受到中国的影响是非常深远的。但同时日本饮食业也创造出了一些自身所特有的饮食并形成日本特有的饮食习惯。寿司就是其中重要代表食品,它既能够成为晚

期刊

寿司日本饮食文化

成年监护制度研究

我国成年监护制度是一项主要依赖于老年人监护制度逐渐发展演变而来的重要民事法律制度。该制度不仅是应对人口老龄化社会的重要措施,更是维护社会稳定,促进和谐发展的关键举

学位

成年监护立法体例监护监督

拿破仑的决策艺术

<正> 拿破仑被认为是历史上与亚历山大·凯撒齐名的伟大军事家,也是最具有历史影响的杰出政治家。他驰骋欧洲政坛和战场30年,战功卓著,声名显赫。拿破仑之所以取得巨大的成就

期刊

拿破仑奥斯特里茨战役

企业社会责任视野下的消费潜规则思考

在企业社会责任理论逐渐受到社会各界广泛认同的背景下,无论是从法理基础来看,还是从现实意义去考量,企业对消费者都不仅仅负有保障其安全权、选择权等权利的义务。本文从这

期刊

企业社会责任消费潜规则政府主导

舒芬太尼或芬太尼复合罗哌卡因在分娩镇痛中的临床疗效对照研究

目的对比分析舒芬太尼或芬太尼复合罗哌卡因分别应用于产妇分娩过程中对分娩镇痛的临床效果。方法1000例产妇作为研究对象,以掷硬币法分为对照组和观察组,每组500例。观察组

期刊

罗哌卡因舒芬太尼芬太尼分娩镇痛临床疗效

理气散结法治疗乳腺增生症的Meta分析及用药规律研究

目的:本研究采用Meta分析对理气散结中成药治疗乳腺增生症的临床疗效和安全性进行客观性评价,应用频数分析和聚类分析的方法归纳总结文献中涉及理气散结法治疗乳腺增生症的用

学位

理气散结乳腺增生症Meta分析用药规律

基于深度学习的低延迟终端命令词识别系统设计与实现

与本文相关的学术论文