基于深度学习的连续语音识别研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：kyunlong

【摘要】

：

【作者】

：

沈东风

【机构】

：

南京理工大学

【出处】

：

南京理工大学

【发表日期】

：

2020年01期

【关键词】

：

语音识别语音切分深度学习声学模型 BLSTM 语言模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

进入21世纪以来,随着计算机技术和人工智能的快速发展,人类和机器之间的交流不再局限于文字符号的输入输出。通过语音识别技术,机器能够轻松地“听懂”语音,甚至用语音和人类“交谈”。因此,语音识别技术,尤其是连续语音识别技术的研究成为一大热点。本文通过连续语音自动切分、声学模型和语言模型三个模块构建了连续语音识别系统。主要工作如下:（1）研究了连续语音的自动切分方法。分析了语音信号特征,选取合适的时域、频域和倒谱域特征作为切分依据。首先通过端点检测找出语音段中的有声段,再利用基音周期轨迹检测有声段中的浊音段,有声段减去浊音段就得到了辅音段,辅音段是音节开始的标志,最后根据语音信号不同频带能量不同的特点,将语谱图划分为5个频带,统计能量的变化,实现了连续元音音节切分和复杂的元、辅音节切分。实验表明该方法取得了较好的切分效果。（2）构建了基于隐马尔可夫模型的声学模型和基于深度学习的声学模型,提取语音信号的24维梅尔频率倒谱系数进行训练,利用同一个语音库进行测试,对比几种声学模型的识别率和性能。实验表明基于双向长短期记忆模型的声学模型取得了较高的识别率。（3）构建了基于N元文法的语言模型,实现了音字转换,并分析了该模型的优缺点。此外,为提高整个语音识别系统的容错性,还进行了语言模型的其他应用实验,在完形填空和文本纠错上都取得了较好效果。

其他文献

基于自然语言的移动机器人任务理解研究与实现

本文研究的移动机器人属于一种服务机器人,任务理解是用于服务机器人的一项关键技术。任务理解就是实现将用户自然语言表达的任务转化为机器人可以执行的原子动作的过程,它包含了两个方面,第一是人机交互,第二是任务规划。本文重点研究人机交互过程,该过程的困难主要表现在语言理解上。语言理解首先要解决指令解析的问题。目前解决机器人指令解析问题的方法或者依赖于人工编制的规则库,不具有学习和预测能力,或者依赖于相当数

学位

移动机器人语义解析grounding逻辑推理概率推理人机交互

数控机床滚珠丝杠副状态识别优化策略及试验研究

滚珠丝杠副作为现代工业母机——数控机床的核心部件,其状态识别方法的优劣一定程度上影响着数控机床的精度与可靠性。本文以国家重大科技专项为依托,对滚珠丝杠副状态优化识别方法开展理论与试验研究,重点研究振动信号多域特征提取方法及状态识别优化组合,通过试验数据与训练模型进一步验证状态识别策略,从而为实现滚珠丝杠副在线监测与健康预警奠定基础。研究滚珠丝杠副状态识别优化策略的根本在于:首先要明确各类特征状态及

学位

滚珠丝杠副优化策略状态识别振动特征提取特征选择多分类支持向量机

联合深度学习隐私保护技术研究与实现

为适应复杂数据环境下的社会发展需求,以提取信息为核心的数据驱动型应用成为新兴产业。与此同时,社会自上而下对于个人隐私保护的意识越来越强,相关法律法规对于用户数据的使用限制也越来越严格,这使得基于大规模数据的深度学习方法必须考虑数据可用性及隐私性的平衡。为解决这一问题,基于分布式数据环境的联合深度学习框架成为了新的研究重点。该框架避免隐私数据的明文搜集以及高复杂度的密文处理过程,允许数据持有者在本地

学位

联合深度学习隐私保护对抗生成网络攻击矩阵盲化并行化

石化成套生产塔施工安全无线监测报警系统

在石化塔的建造过程中,塔内受限空间施工作业的安全性与环境密切关联,要求对受限空间的氧含量、温湿度实时监测,在参数超出行业规定的范围时及时报警。集环境参数实时采集、无线远程数据传输及远程集中监测及报警功能于一体的石化塔受限空间环境自动监测报警系统是石化行业急需的装备。本文受中石化委托,研制石化塔受限空间环境自动监测报警系统,包括研制集环境参数检测、人员施工塔及施工层定位以及报警功能于一体的手持终端,

学位

环境监测人员定位混合无线通讯ID3决策树算法预警机制

基于数据驱动的工控设备故障检测技术研究

随着工控系统的复杂性和维护成本的不断增加以及信息技术的飞速发展,工控设备对性能下降、生产率降低以及安全隐患的容忍度越来越低,及时发现工控设备的故障对于工控系统安全、降低维护成本有着重大的意义。随着工业互联网的发展,接入到网络中的工控设备越来越多,工控设备运行状态的数据采集工作也更为容易,这为基于数据驱动的故障诊断提供了研究基础。论文从安全性、可靠性、准确性、扩展性等角度出发,对工控设备的故障检测方

学位

故障分类序列水印卷积神经网络集成学习

滑阀式固冲发动机流量可调燃气发生器控制系统研究

固体火箭冲压发动机相对于其它传统的动力系统来说具有较好的工作性能,因而被广泛应用于战术导弹上。具备燃气流量调节功能的固体火箭冲压发动机可使导弹在大空域、宽马赫数范围内机动作战,可使导弹在飞行过程中补燃室内的空燃比处于合理的工作范围之内,种种优势使其备受各国国防工作者的重视。本文针对滑阀式固冲发动机流量可调燃气发生器控制系统展开研究,研究内容包含燃气流量调节原理、控制系统设计、系统建模、流量调节系统

学位

燃气发生器流量调节负调特性免疫粒子群自抗扰控制器

基于深度检测网络的OCT图像视网膜病变分析与应用

脉络膜新生血管（CNV）是老年性黄斑变性（AMD）的重要特征。基于光学相干断层扫描（SD-OCT）图像的自动CNV检测可以极大地帮助CNV临床诊断。随着深度学习的飞速发展,目标检测领域也取得了长足进步。本文针对现有目标检测模型应用到医学图像中的问题,结合SD-OCT图像和CNV病变的特性,开展使用深度学习对CNV进行高效精准检测的研究和应用,具体工作如下:（1）提出了基于特征融合和邻域传播的CNV

学位

目标检测SD-OCT图像视网膜新生血管YOLOv3可倾斜边界框CNV检测系统

基于卷积神经网络的图像超分辨率重建

图像超分辨率重建是一种根据低分辨率图像预测出细节丰富的高分辨率图像的方法。其可以克服成像设备等硬件的缺陷,通过软件的方法重建退化的图像,在安防监控、医学图像、视频播放等领域有着广阔的应用前景,是图像领域研究的热点。随着计算机硬件的发展和理论的完善,深度学习得到了极大的发展,在图像分类、目标检测、图像生成等领域成果显著。本文将基于深度学习中的卷积神经网络开展对图像超分辨率重建算法的研究,主要工作如下

学位

图像超分辨率重建卷积神经网络渐进式重建生成对抗网络

基于深度神经网络注意力模型的小目标检测与字符识别

目标检测的任务是从图像或者视频中定位目标并对目标进行分类,对只占据少量像素的小目标进行检测的任务称为小目标检测。小目标像素少、携带信息少,特征容易淹没在背景中,因此小目标检测一直是目标检测的难点。字符识别的任务是提取图像中存在的字符并组合为字符串输出。在自然场景的字符识别中,由于背景复杂、字体多样且字符分布随意等原因,识别精度较低,难以满足实际需求。在铁路接触网异常自动检测系统中,接触网支柱号是定

学位

接触网图像注意力模型小目标检测字符识别

基于标记相关性的多标记学习研究

单标记学习方法通常用于解决一个对象仅与一个标记相关的问题。目前,对单标记学习的研究已经比较成熟,然而,现实生活中的对象往往具有多种语义,同时使用多个标记描述一个对象可能更符合实际需求,而已有的单标记学习方法可能无法有效地处理这类任务。因此,多标记学习框架被提出来用于处理一个示例同时与多个标记相关的问题。为了提升模型的分类性能,考虑如何提取和利用标记相关性以及通过标记特定特征学习是目前多标记学习中的

学位

多标记学习标记相关性样本相关性标记特定特征学习面部表情识别

基于深度学习的连续语音识别研究

与本文相关的学术论文