深度学习语音识别系统在嵌入式端的研究

来源 :成都理工大学 | 被引量 : 2次 | 上传用户：zjzhanjx

【摘要】

：

随着深度学习技术的研究进展,语音识别同样已经完成了从传统模型到深度学习的过渡,本文主要目的是解决移动端离线状态下的语音识别并提高语音识别的精度。本文采用深度学习的

【作者】

：

杨明翰

【出处】

：

成都理工大学

【发表日期】

：

2019年01期

【关键词】

：

深度学习嵌入式语音识别声学模型语言模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着深度学习技术的研究进展,语音识别同样已经完成了从传统模型到深度学习的过渡,本文主要目的是解决移动端离线状态下的语音识别并提高语音识别的精度。本文采用深度学习的方式,利用首先在电脑上训练好的模型移植到树莓派3b+上进行语音识别操作。项目整体结构可以分为声学模型及语言模型两个部分,声学模型由优化后的DFCNN(Deep Fully Convolutional Neural Network)构建训练而成,将声音信号转换成语谱图后通过优化后的DFCNN模型进行训练,训练完成后可以将输入的语音信号转换成拼音。语言模型采用谷歌针对英德互译所构造的模型框架Transformer编码器部分进行模型搭建及训练,将拼音转为汉字。针对上述模型本文还做了相关工作:1、利用深度学习框架Tensorflow构建DFCNN模型和Transformer编码器部分两个模型后完成训练,其中针对DFCNN模型进行优化。同时利用Tensorflow的量化系统将模型量化后,移植于嵌入式平台即搭载linux系统的树莓派3b+上,实现嵌入式端的语音识别。2、为了使样本足够丰富,选择清华大学开源的THCHS30的音频库进行训练。对于声学模型,摒弃了传统的MFCC和LPCC等特征值提取方式,采用类似图像识别的方式通过卷积神经网络提取特征值。利用python将语音信号预处理后转为语谱图作为DFCNN模型的输入数据。同时对比训练好的Bi-LSTM模型,在电脑和树莓派3b+上的识别速度和性能进行了测试及分析。3、语言模型部分利用Transformer编码器部分进行建模后,将处理后的拼音文件和汉字文件输入模型并训练。拼音文件和汉字文件皆通过生成的词典提取相应的ID列表并填充后输入模型。在测试阶段对比了传统的n-gram模型的性能和速度,分析了Transformer编码器模型的优劣。4、树莓派3b+通过安装ReSpeaker 2-Mics Pi Hat相关软硬件,可以针对说话人进行语音信号的采集,此硬件可以滤去一定的噪音,并通过预处理进一步提高音频信号的信噪比,提高识别率。利用训练集和收集到的实验室同学的音频信号,同语音识别中其他主流模型进行对比测试后,得到的结论是声学模型DFCNN和语言模型Transformer的编码器部分都适合移植于嵌入式端,且识别效果和速度都达到了期待的程度,实际运用中的识别率和识别速度也令人满意。

其他文献

非线性波浪统计分布的高阶谱数值模型研究

极端波浪是一种,发生概率低,发生突然,波高很大,破坏力极强的波浪。对于极端波浪的成因存在很多理论。有理论认为在深水中由于波浪的三阶非线性相互作用,调制不稳定的存在,会

学位

非线性高阶谱模型峰度波高分布波峰波谷分布

史锁芳教授治哮验案

史锁芳教授论治支气管哮喘分为5型治疗。风痰阻肺型:治宜祛风宣痹,药用射干、麻黄、杏仁、桑白皮、蝉蜕、炙蜈蚣等。痰浊痹阻、肺气郁滞型:治宜泄浊通阳、开宣肺气,药用射干

期刊

史锁芳祛风宣痹泄浊通阳辛温散邪益气祛风

山东省西瓜、甜瓜发生瓜类细菌性果斑病

山东省寿光市和昌乐县发生瓜类细菌性果斑病，该病种子带菌，病原菌为 Acidovorax citrulli （Schaad et al.2009），危害葫芦科作物。应加强检疫和防治工作。

期刊

西瓜甜瓜细菌果斑病

基于线性规划的Petri网结构分析

柔性制造系统(FMS)通过资源共享的方式生产加工出各种各样的产品,基于对有限资源的竞争,死锁现象可能会出现在FMS中。如果死锁发生,就会导致系统被阻塞,系统的效率和生产力就会降低。因此,在FMS系统的设计与控制过程中,必须考虑死锁问题。Petri网是一种适合对FMS系统进行建模和仿真控制的工具。基于结构分析在FMS的死锁控制中起着重要的作用。Petri网结构中,信标和资源环是两种特殊的结构,它们和

学位

Petri网整数线性规划结构分析约束条件可达标识

我国航空公司内部控制缺陷及对策分析

近年来,随着国际竞争加剧、国内经济增速放缓以及高铁快速发展,我国航空公司面临的风险愈发纷繁复杂,生存压力日益加大。建立并严格执行一个完善的内部控制制度对航空公司防

期刊

航空公司内部控制问题措施

实验性自身免疫性神经炎和实验性自身免疫性重症肌无力的潜在治疗靶点研究

研究背景吉兰巴雷综合征(Guillain-Barre syndrome,GBS)是一种免疫介导的周围神经病,临床表现为快速进展性、对称性肢体运动功能障碍,反射降低或消失,常伴有自主神经功能紊乱

学位

糖酵解2-脱氧-D-葡萄糖实验性自身免疫性神经炎巨噬细胞ONX-0914实验性自身免疫性重症肌无力抗体亲和力

工作—家庭冲突研究综述

随着世界经济格局与中国社会经济的变革,人们的工作特征、生活方式及家庭结构发生了新的变化,工作—家庭冲突问题备受广泛关注。本文通过回顾国内外工作—家庭冲突的研究文献

期刊

工作—家庭冲突关系理论前因变量结果变量

国内学术界关于“共享发展”研究述评

共享发展理念提出以来,国内学术界从其形成、内涵、特征、价值、现实挑战、实践路径等方面进行了广泛而深入的研究,取得了较为丰富的研究成果。深化共享发展问题的研究,需要

期刊

共享发展理论阐释实践路径

美国空军与休斯公司签订8500万美元的GBS合同

美国国防部最近宣布,已与休斯信息系统公司(休斯飞机公司的一个成员)签订8500万美元的合同,为美国军方提供全球广播服务(GBS)系统.休斯信息系统公司(HIS)将是GBS系统的主承包

期刊

信息系统GBS美国空军

智能纺织品及其在安全防护服装中的应用进展

从智能纺织品(系统)的定义出发,阐述了它和安全防护服装的天然联系,梳理了功能型智能纺织品和电子型(可穿戴)智能纺织品的研究现状。根据使用需求的不同,从大众消费防护服饰

期刊

智能纺织品安全防护服装应用

深度学习语音识别系统在嵌入式端的研究

与本文相关的学术论文