基于深度神经网络的端到端语音识别研究

来源 :上海应用技术大学 | 被引量 : 0次 | 上传用户:tewy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,语音识别作为人机交互的核心技术之一,在智能家电、工业控制、客户服务中心、车联网等领域具有广阔的应用。语音交互是人与人之间沟通的最主要、最便捷的方式。传统的语音识别框架主要包括声学模型、语言模型、字典、解码器等模块,模型组件较为复杂。近年来,端到端的语音识别技术由于其框架的简洁性和模型易于训练的特性逐渐成为大规模连续语音识别的发展趋势。本文提出使用改进的门控循环单元网络和端到端技术对语音识别系统建模,从端到端技术和深度神经网络两个方面对语音识别进行探索,主要开展的研究工作如下:(1)利用连接时序分类(CTC)的端到端方法对语音识别系统进行建模,找出语音和标签之间的映射关系,削减了传统模型中的标签预对齐步骤,降低了传统模型的复杂性。(2)提出对门控循环单元网络进行改进,改进的门控循环单元采用双向循环神经网络结构,能够更好的学习上下文时序信息,同时移除了重置门结构,在状态更新过程中采用Re LU激活函数并与前馈连接采用的BN算法有效结合,改进的门控循环单元可以降低模型的复杂度,加速模型收敛。(3)将改进的门控循环单元网络与连接时序分类算法进行结合对语音识别系统进行端到端建模,在英文数据集TIMIT和自制小型语料库上进行实验验证和分析,研究结果表明,与基线模型相比,基于改进门控循环单元的端到端语音识别模型取得了较低的词错率,并在训练速度上有明显提升。
其他文献
机器人制造业被誉为“制造业皇冠顶端的明珠”。随着工业4.0和中国智能制造2025的不断推进,工业机器人不仅在生产制造业中被广泛应用,也成为了学者们研究的焦点。但是,目前大量工业机器人控制算法的研究仅仅停留在了数学方法验证层面,这也导致了机器人控制算法无法得到实物验证与仿真验证。针对以上问题,本文提出了一种将运动学、路径规划、控制算法、虚拟仿真于一体的创新研究方法,该方法对控制算法进行验证时具有安全
学位
为了实现企业总部与分部之间主备链路的故障倒换,满足高可用性的需求,提出了静态路由与服务等级协定进行联动的实验方案。采用分组网络模拟器(Packet Network Emulator Tool,PNET)对实验方案进行了仿真,在仿真中模拟了主链路故障。经过测试,验证了实验方案的可行性。该方案适用于社会生产的真实项目,具有较高的参考价值。
期刊
随着无线通信技术及其增值业务的迅速发展,致使人们对数据流量的需求呈爆炸性增长,这给当前及未来无线通信网络带来了诸多技术挑战。数据流量迅猛增长的需求迫使人们重新考虑无线频谱再分配问题,以便在频谱资源有限的情况下给整个网络提供足够的吞吐量。认知无线电技术能够有效改善无线频谱的分配,从而缓解无线电频谱资源的紧缺状态,提高了频谱的利用率。本文采用机器学习理论研究频谱预测技术和频谱共享技术,实现频谱分配,提
学位
<正>地域文化是特定地理环境与人文风俗的产物,它体现着一个地区人们的生活方式、思维习惯、价值理念和审美偏好。地域音乐作为珍贵的非物质文化遗产,经历了长期的历史演变,与地域文化相互融合,形成了相辅相成的关系。基于此,本文立足音乐的地域性特色,参考《中国音乐》中《民族音乐学与传统音乐理论》栏目的相关文章,深入分析了地域文化对音乐风格、音乐旋律的影响,以及地域文化元素在音乐中的体现,为推动地域音乐文化的
期刊
在现代工业上,大部分生产过程的系统是复杂的、不确定的,其模型难以建立,对于这种系统的控制十分的困难。无模型自适应控制(MFAC)拥有较好的参数和结构自适应能力,它不依赖控制对象的具体模型信息,仅依靠被控系统的I/O数据对被控系统的梯度向量进行在线估计,从而得到相应的控制器,消除了模型对系统的影响。本文提出了一种改进的基于递归梯度的MFAC算法,其中以前一时刻参数变化的形式添加动量项,既考虑了梯度下
学位
白藜芦醇是一种广泛存在的多酚化合物,具有抗肿瘤、抗氧化、抗炎、心血管保护等药理活性,在保健品和化妆品领域应用广泛。近年来,大量实验研究证明白藜芦醇及其衍生物通过多种机制提高机体的抗疲劳和抗衰老能力,同时在神经保护、抗炎、抗病毒、抗糖尿病、保护心血管等方面取得显著效果。本文综述白藜芦醇及其衍生物的药理特性及作用机制的研究进展,为促进白藜芦醇及其衍生物的产品开发提供参考价值。
期刊
物体表面缺陷检测的研究在各个领域都有重要意义。本文为了探寻和改进物体表面缺陷检测的方法,利用改进的卷积神经网络(CNN)模型以磁瓦为检测对象对物体表面缺陷检测进行了研究,主要研究内容如下:1.本课题研究磁瓦表面缺陷检测,拍摄了磁瓦原样本图片,制作了包含磁瓦表面各种缺陷如小孔、缺损、裂纹等缺陷的数据集作为研究所使用的主要数据集,数据集中一共有3300张处理好并打上标签的图片。2.由于磁瓦的各种缺陷样
学位
皮肤问题是比较常见的疾病问题,其中皮肤癌具有极高的致死率,如在早期能够检测出病变并及时进行治疗能有效降低该疾病的致死率。但传统的人工诊断方式存在一定的主观性容易造成检测误差,同时无法满足复杂多样皮肤问题实时检测的需求。目前,针对皮肤检测的问题,国内外研究人员主要利用大型专业的皮肤检测设备,但在无法满足人们对皮肤的实时检测需求。因此,设计一种可以用于便携式设备,快速、准确进行皮肤检测的方法,对于普通
学位
在过去的几年中,随着信息技术的飞速发展,制造业进入了一个快速变革的时代,MES系统也开始广泛应用于制造企业。现在快速识别客户需求并将其反映到车间这一点也非常重要,这是由以生产者为中心到以客户和参与者为中心的市场环境的变化引起的,此外,大多数制造企业都面临着减少上市时间、整体制造质量、速度和成本改进的压力。为了应对这些巨大的挑战,制造商需要灵活配置制造车间,制造执行系统(Manufacturing
学位
随着日新月异的科技进步与人工智能的迅速推进,零售业务在国内各商业银行发展得越来越快。我国拥有巨大的零售市场发展空间和零售业务消费人群,为了满足我国消费者对银行零售业务日益多样化的需求,零售业务成为各家商业银行应对日趋激烈的金融市场竞争环境,进而发展和巩固自身竞争力的关键性领域。目前,各商业银行竞相大力开拓和发展结合自身实际情况的零售业务。徽商银行作为安徽省区域性商业银行在促进和发展地方经济方面扮演
学位