基于深度学习的音素特征识别研究

来源 :陕西师范大学 | 被引量 : 2次 | 上传用户:asdfghjki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为日常交流的重要方式,在人类发展历程中占有无可替代的地位。21世纪后,神经网络的重新提出和互联网的快速发展将语音识别技术推进到一个新的阶段。由于模式识别的进步,语音识别作为人机交互的重要组成是当前研究的热点。在语音的特征提取、声学模型识别和解码三个步骤中,特征提取作为语音识别的第一步尤其重要,随着深度学习在语音识别领域的成功应用,使用神经网络的深度结构可以实现对语音数据的复杂函数计算和高维学习,提取出比浅层结构分类效果更好的音素特征。近年来,大量的研究人员提出了多种利用神经网络的深层结构来提高语音特征识别率的方法,尽管在一定程度上取得了较好的效果,但是语音识别的研究技术仍存在进步的空间。本文为降低语音特征的识别错误率,首先,从语音信号中提取传统特征,然后对传统的特征进行音素提取;其次,建立新的串联系统模型,通过相关状态的共享结构来减少计算复杂度,同时充分利用深度学习框架中生成性网络的映射方式和学习能力,进行特征参数的提取;最后,经过声学模型的学习识别与解码后得到音素识别错误率,并以此为指标判断模型的效果。本文主要的研究内容如下:(1)子空间高斯混合模型在状态空间共享同一结构的情况下,可以通过改变全参数空间的均值与权重来减小计算规模,然后从向量空间到参数空间进行全局映射,通过两步E-M算法对维特比状态下的基线和数据作对齐训练,并且在相对独立的空间中适应每个语音状态,从而获得训练后的语音音素特征。利用在开源平台上的TIMIT语音库进行传统特征提取,考虑到提取过程中信号的鲁棒性,在输入模型前对传统特征先进行相关的降维处理。通过实验可以看出,子空间高斯混合模型对训练后的语音音素特征识别效果优于未经过训练的传统特征。(2)建立子空间高斯混合和深度神经网络的串联系统提取音素特征,将传统特征先进行降维分析后作为串联系统的输入量,输入到第一级的子空间高斯混合模型中;然后通过空间共享和减少待估计值的参数规模获得区分训练后的输出特征,并将这一输出特征作为第二个模型的输入特征,在深度神经网络中做非监督训练,通过反向传播算法对模型的参数修正后得到深度特征;最后对其进行声学模型识别及解码。在开源平台上的TIMIT语音库中进行上述实验,对比音素识别错误率,可以看出串联系统提取的特征效果明显好于传统特征。
其他文献
目的:在细胞水平研究ARK5与胃癌多药耐药的关系,明确沉默ARK5基因能否有效逆转胃癌多药耐药细胞SGC7901/DDP的耐药性。方法:1.设计针对ARK5基因的RNA干扰(RNA interference,RNAi)序列及阴性对照(negative control,NC)序列,并已完成对LV-ARK5-RNAi重组慢病毒载体和阴性重组慢病毒载体的构建;2.用带荧光(GFP)的阴性重组慢病毒载体感
IPTV是运营商重要的基础业务,能为用户提供丰富多彩的视频直播、点播服务,深受用户好评和喜爱。因此IPTV的业务发展情况较好,装机量较大。由于IPTV是基于宽带安装,安装过程较
从教学思维角度出发,以心理学教学实际应用为主要目的,提出在实践教学过程,教师要具备良好的心理学基础知识,完成好角色的变换,将心理学知识合理有效地应用到课堂教学过程中,
【目的】探讨PTEN,Bcl-2基因在骨肉瘤中的表达情况及其相互间的关系,了解其在肿瘤转移、复发中的作用为骨肉瘤病因的探讨、临床病情的判断及对骨肉瘤的防治提供依据。【方法
最近我们单位在业务学习时,讨论了立卷方法,有人提出,最好的立卷方法就是“一事一卷”。我对此有不同看法,谈出来跟大家探讨。文件是党和国家发布政策、法令,指导工作和洽商
随着经济的快速发展,桥梁建设也取得了较快的进展。为满足人们日益增长的生活需求,桥梁建设方兴未艾,其质量需要严格保证。本文结合道路桥梁施工管理中存在的问题,对桥梁的施
图形符号研究已经成为视觉传达设计领域的热点,采用传统方法没有结合历史数据,对信息应用研究并不全面,导致研究效果较差,为了改善该问题,以信息整理为重点,提出了基于大数据
<正>十八大以来,让国人生活更加幸福成为党和政府的执政理念和执政方向。作为幸福生活之源,提升家庭幸福感对于维护社会和谐稳定、促进经济健康发展、建设美丽富强中国、实现
在我国的金融体系之中,商业银行也存在一席之地,对金融和经济发展有着不能否认的重要作用。近年来,我国商业银行不光外部风险增加,内部风险也逐年升高。银行内部采用的传统审
采用静态顶空-气相色谱法测定华润雪花啤酒中的醛类、乙醇、高级醇、高级酯等风味物质。乙酸乙酯、乙酸异丁酯等组分的线性相关系数为0.999 1~0.999 9,各组分的最小检出质量浓