语音分离与语音识别关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhefen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人类最为基础的信息交流媒介,一直以来都是工业界与学术界研究的重点,本文主要针对语音分离与语音识别问题进行研究。其一,由于现实环境中语音环境复杂,语音的可懂度受到较大干扰。语音分离技术是解决此问题最常用的方法之一,目前的语音分离技术存在语音信号表征不充分、难以从混合语音中学习到有用信息等问题;其二,语音识别技术的目标为将语音信号识别为对应的文本序列。然而,许多系统只需要检测出其中的关键词即可,这种技术称为关键词识别技术。目前,随着深度学习的兴起,基于深度学习的关键词识别模型多为按帧标注方法,需要较为成熟的大规模连续语音识别系统对训练样本进行按帧标注,该类模型先决条件较为苛刻,且不灵活。针对语音分离与关键词识别目前研究存在的问题,本文的研究内容主要包括以下两方面的内容:1.针对于语音分离存在的语音信号表征不充分、难以从混合语音中学习到有用信息的问题,本文提出深层转导式非负矩阵分解(DTNMF)方法,在非负矩阵分解(NMF)的基础上,引入了全新的深层结构,这种深层结构可以非线性地表征语音信号,并引入了转导式学习的思想,即在识别时联合训练数据与测试数据生成字典,因此同时利用了混合语音信号的纯语音信号,从而使得本方法能够更好地从其他类似的混合语音中分离出各个声源的纯语音信号。实验为在不同信号比下的两说话人的语音分离实验,实验结果表明,DTNMF能够有效地从混合语音中还原出各说话人的语音信号,并能够更有效地减少其他说话人的污染,由此得到比转导式非负矩阵分解和非负矩阵分解更好的语音分离效果。2.针对按帧标注的关键词识别模型存在的问题,本文提出了一种基于联结主义时序分类器的关键词识别方法,该方法是端到端的神经网络结构,输出层为CTC层,可以有效地识别序列信息。本文采用多层双向长短时记忆神经网络模型,该类网络结构能够保存双向的、长距离的上下文信息,并在一定程度上解决了梯度消失与梯度爆炸的问题。在该模型的基础上,本文提出了剪裁关键词识别模型输出空间的改进方法,提高了模型的收敛速度,缩小了搜索空间,降低了模型的复杂度;同时,也避免了维度灾难的问题。实验结果表明,在相同训练集与测试集的情况下,本文所提出模型的关键词识别效果优于传统的按帧标注方法;本文所使用的BiLSTM网络结构有效地提高了所提出模型的关键词识别效果。
其他文献
基于非线性扩散滤波提出了可以同时对同质区域进行平滑和对结构信息进行增强的算法.该算法在同质区域采用各项同性滤波而在边缘附近采用各项异性扩散滤波,避免了图像平滑和增强结构信息之间的矛盾.在实现时,根据一致性程度选择扩散矩阵的扩散系数,可确保偏微分方程在离散化时的简洁性和一致性.数字实验结果表明,可以有效的平滑一致性低的区域并增强一致性高的结构.
以浓香型主产烟区代表性C3F等级初烤烟叶为试验材料,检测了As、Cd、Cr、Ni、Pb的含量,并将所选样品切丝卷制成单料烟烟支,以剑桥滤片捕集主流烟气中的总粒相物,对主流烟气中H
本刊讯“陶瓷精英汇,服务万里行”系列之陶瓷名城淄博行活动拟定于9月初举办,据了解,本次活动的主旨既是服务展商,也是服务各大陶瓷厂区的陶瓷行业,届时,将会邀请到神秘嘉宾对当前
采用较简单的双点源真空蒸发法在光栅外表面上蒸镀一层均匀铝膜,利用电流流过铝膜时产生的电阻热改变光栅的温度而使光栅的中心波长向长波方向发生改变.光栅中心波长的变化与
社会经济的飞速发展带动着称重系统不断进步,从人工指挥到无人值守的不停车称重系统,这巨大的变化是经过反复的研究和改进得以实现的。无人值守的称重系统不仅减少了人工的操作过程,降低了人为错误和舞弊的可能性,而且加快了整个称重过程。基于环保技术公司的传统称重系统日益暴露的弊端,本文设计了新的称重系统。本文对国内外的称重系统进行了分析,结合场地情况和系统需求,设计了诱导屏和压线检测摄像机组合的无人值守称重系
随着时代的进步与人们生活水平的不断提高,移动通信技术更新换代,人们对于移动通信需求也在不断加大。传统的基站覆盖能力无法达到深度覆盖要求,对于居民区人数较多时容量需
转体桥梁球铰的封闭好坏,直接关系到桥梁的整体寿命,而客运专线对结构物耐久性的要求更为突出,以京石客运专线滹沱河转体桥为倒,从方案的比选入手,详尽阐述了球铰封固混凝土的施工
目前数字水印算法多局限于在图象中嵌入特定的标记,并通过改变空域值或频域系数值来达到目的.提出了一种新颖的自适应盲水印方法.首先基于小波变换的零树结构,找出重要系数,
本文在Cirac-Zoller模型的框架下,讨论在离子阱中如何实现多量子比特Grover搜索的方案。
本文报道了用可变入射角椭圆偏振仪(Variable angle incidence Spectroscopic Ellipsometer)测量Alq,NPB,CuPc,Rubrene薄膜的光学常数,我们采用真空蒸镀法在硅衬底上分别制备了以上四种薄膜,然后我们用可变入射角椭圆偏振仪对四种薄膜进行了测量,测量在大气中进行,光谱范围从200到1000nm(或1.24到5eV),测量角度为65°、70°、