基于深度神经网络的声学特征学习及音素识别的研究

被引量 : 0次 | 上传用户：morgan1912

【摘要】

：

音素识别作为语音识别的一个子领域，一直是语音识别研究的一个非常重要的内容。音素识别的效果主要用于衡量声学模型的优劣。自从深度神经网络被引入到音素识别领域之后，语音识

【作者】

：

郑鑫

【发表日期】

：

2014年期

【关键词】

：

音素识别语音识别神经网络特征学习深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

音素识别作为语音识别的一个子领域，一直是语音识别研究的一个非常重要的内容。音素识别的效果主要用于衡量声学模型的优劣。自从深度神经网络被引入到音素识别领域之后，语音识别技术及其研究获得了迅速的成长。目前许多研究者从提出不同的神经网络模型的角度来提升音素识别的效果。虽然这一研究思路在短时间内取得了一些进展，但是目前神经网络和深度学习技术应用的还存在着另外一种研究思路。这种思路被称作特征学习或者表示学习。这种思路目前在计算机视觉领域正在受到越来越多的关注，然而在语音识别领域还远未受到足够的重视。本文从特征学习这一思路入手，提出了一系列应用于声学特征参数的特征学习算法，从几个不同的角度从原始声学特征中学习出新的特征，然后基于这些新的特征进行音素识别任务，以验证这些特征的实际效用。本文的主要研究工作及贡献如下：一、提出了串联深度神经网络模型，并将其应用于音素识别任务。串联深度神经网络使用两级深度神经网络作为声学模型，原始声学特征参数通过第一级深度神经网络之后得到的后验概率分布被作为新的特征，输入到第二级深度神经网络中进行识别。在这样的过程中，第一级的深度神经网络可以被看作是一种特征学习的方法。我们深入研究了第二级深度神经网络的参数配置对音素识别性能的影响，在TIMIT核心测试集上的实验表明，基于最佳配置的串联深度神经网络模型的音素识别准确率相对提升了4%。二、提出了多变量高斯受限玻尔兹曼机模型，并将其作为特征学习模型应用于鲁棒性语音识别。多变量高斯受限玻尔兹曼机的提出是为声学特征参数向量定制的，目的是为了解决高斯受限玻尔兹曼机在描述声学特征参数向量中的劣势。在Aurora-2测试集上的噪声环境下的音素识别实验表明，与原始的声学特征参数相比，基于多变量高斯受限玻尔兹曼机模型提取的特征识别准确率平均提升了10%。三、提出了一种被称为对照自编码器的模型，该模型能够从原始声学特征参数中学习仅与特定任务相关的特征参数。一段语音的声学特征参数可能同时含有音位学、说话人特征相关和噪声等众多信息。这些信息有些与当前的特定任务有关，而有些无关。对照自编码器通过同时对两个深度自编码器以及它们之间的相互关系进行建模并联合优化，从而可以从原始声学特征参数中学习出新的与特定任务（如音素识别）相关的特征参数。实验证明了这种参数相对于原始声学特征参数在音素识别任务中的优势。四、提出了一种基于神经网络进行动态特征学习的框架，该框架可被用于学习可以替代传统动态特征的新动态特征。动态特征是语音识别中使用的声学特征参数的重要组成部分，我们提出使用神经网络学习动态特征，可以将动态特征的计算推广到一个更大可能的空间之中，并且通过对特定任务比如音素识别的优化来学习到最适合特定任务的动态特征计算方式。实验证明了该方法学习到的参数的有效性，并且发现在使用高阶参数的时候更为有效。

其他文献

中国梦指引下的当代大学生社会责任感问题研究

中国梦提出时间是在2012年,习近平总书记首次提出“中国梦”----这一伟大的具有中国特色社会主义建设的指导思想,彰显了中国共产党对于中华民族复兴的伟大构想,“中国梦”同

学位

“中国梦”大学生社会责任感研究对策

高校榜样教育育人功能发挥研究

高校榜样教育是高校开展思想政治教育的重要载体,是实现大学生精神“补钙”的内在要求,也是落实高校立德树人根本任务的必然要求。而高校榜样教育育人功能作为高校榜样教育价

学位

高校榜样教育育人功能发挥

教学视频中教师形象呈现方式对大学生学习的影响研究

在大规模开放在线课程崛起的同时,高辍学率也伴随着它。教学视频作为大规模开放在线课程的主要组成部分,对学生的在线学习起着举足轻重的作用。国内外研究证明了教学视频中的

学位

教学视频线索教师形象呈现方式知识类型

大学英语教学微课的碎片化应用浅谈

本文是探讨如何将微课模式引入传统大学英语教学,并据此分析碎片化应用学习对学生的自主学习促进作用以及产生的问题,并提出相应的策略。

期刊

大学英语微课碎片化

日本国立大学法人化改革对中国高校去行政化的启示

2010年7月,《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称《纲要》)正式发布,明确指出了“推进政校分开、管办分离”,标志着我国高校去行政化改革正式拉开了

学位

高校去行政化法人化改革立法

高校排舞运动的现状及发展对策研究

目的：为排舞在高校的开展提供一个宽松的环境，得到相关方面的重视和支持，以此推动排舞运动在高校的发展，为高校体育教学课程改革以及大学生课外体育活动的开展提供一定的参考。方

学位

高校排舞现状对策

基于水泥工厂远程运维的数据安全分析

水泥工厂远程运维是将生产过程中产生的工艺数据、设备数据及能耗数据等,通过先进的编程算法,采用最新的互联网技术,展现给生产管理人员;通过报表分析及数据对比,形成数据化

期刊

水泥工厂远程运维数据安全

微生物方法生产L-半胱氨酸的研究进展

微生物方法生产 L-半胱氨酸较化学方法具有相当的优越性 ,生产步骤简化 ,底物转化率高 ,可降低污染等 ,但由于技术原因 ,很少见成熟生产工艺的报道。近年来 ,出现了分别以 DL

期刊

微生物酶法半胱氨酸胱氨酸固定化基因工程技术

有关行政规章若干问题的法理分析

行政规章是有关国家行政机关依据宪法、法律和法规制定的具有普遍约束力的行政法律规范性文件的总称。根据制定主体不同,可以分为部委规章和地方规章。自现行宪法确认行政规

期刊

国务院各部委宪法和法律现行宪法法理分析法律依据具体行政行为国家行政机关宪法解释公安部

鱼油在疾病防治中的应用

期刊

鱼油疾病防治

基于深度神经网络的声学特征学习及音素识别的研究

与本文相关的学术论文