复杂场景下端到端的鲁棒性声学模型研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:jiguso198735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术在无噪环境下取得了突破性的进展,但在带噪环境下识别性能仍然存在下降的问题。因此,鲁棒语音识别研究受广泛的关注,如鲁棒语音特征提取、语音增强和鲁棒性声学模型等。鲁棒性声学模型是提高语音识别系统抗干扰能力的关键技术。然而,鲁棒性声学模型在实际应用中仍然存在很多有待克服的技术问题,譬如对未知噪干扰的泛化能力和对复杂应用场景的建模方案。为了解决这些问题,本课题从端到端的声学模型和深度神经网络出发,针对加性噪声的鲁棒模型进行研究,并使用了音素错误率指标来刻画模型性能。本文的创新点总结如下:1)本文提出一种基于参数共享的深度相似网络。具体来讲,首先,通过结合卷积神经网络与联结主义时间分类算法(Connectionist Temporal Classification,CTC),在干净语料中建立了端到端的声学模型,获得接近于基线模型性能。然后,受师生训练与多条件训练的启发,提出一种参数共享的训练方法,提高了模型的鲁棒性。最后,利用参数共享和CTC算法特点,提出一种深度相似网络,使得带噪样本与干净样本获得相似的概率矩阵输出,进而获得更鲁棒的识别效果。2)结合深度相似网络,本文提出一种基于前端分类的端到端鲁棒性声学模型。前端分类包括特征设计、特征提取、分类模型。针对特征设计,提出一种基于长时能量的噪声特征工程,并在2018DCASE开发集中验证特征的有效性,分类准确率优于基线模型约14%。针对特征提取和分类模型,提出一种分解式的变分自编码网络,从带噪语音中提取噪声特征,搭建前馈神经网络进行分类。3)为了减少后端训练多个声学模型的时间开销和计算资源,提出一种具有低秩特性的迁移学习方法。该方法将神经网络压缩的思想与迁移学习相结合,在源域模型的基础上引入低秩网络学习目标域的任务,使得后端声学模型复用前端的训练参数,从而节省了模型训练的时间开销和计算资源。
其他文献
耐甲氧西林金黄色葡萄球菌(Methicillin-resistant Staphylococcus aureus,MRSA)具有多重耐药性,是一种严重危害人类健康的致病菌。其富集附着形成的生物膜(Biofilm)结构导致的细菌耐药性增强是已有抗生素治疗失败的主要原因。细菌生物膜是目前抗感染治疗中面临的一个重大难题,因此,迫切需要找到能够抑制MRSA生物膜形成和清除其成熟生物膜的方法。本研究从红树植
随着数字媒体技术与网络的不断更新与发展,网络艺术也在网络媒介、移动终端、互动媒体等新兴的媒体上以非常快传播速度流行于互联网。这种依赖网络技术与新媒体技术而发展起来的网络艺术已经影响到各个设计领域,尤其是视觉传播设计领域。本文主要以蒸汽波艺术作为切入点来探讨基于融合媒介将互动性设计方法融入传统的二维视觉设计当中。蒸汽波艺术是2010年左右在互联网诞生的典型的网络艺术,兼具视听特点的一种具有感染力的艺
瀑布是中国山水画创作的重要题材。在山水画中瀑布具有视觉引导(体现在两个方面:一方面是瀑布自上而下流动所带有的明显方向性,具有强化视觉中心的作用;另一方面是瀑布空间转折的引导作用。)、营造氛围、缓解视觉疲劳等重要作用。而在传统山水画创作中如何巧妙运用瀑布是一门艺术,综合来看瀑布的运用应符合画理、依画面氛围而定,以及把握画面整体布局关系、合理经营瀑布位置(一、借鉴“三分损一”原理,经营瀑布位置。二、结
本文尝试以居伊·德波的景观社会理论为视角,探讨了景观与场所的相关性问题,并就此展开几位中国当代艺术家一系列的作品研究,进而论述场所作为一种景观的呈现,其在当代艺术中的表达及其精神性问题。在此,将几位具有代表性的中国当代艺术家作品,从历史的景观、现实的景观、荒诞的景观三个方向展开深入的描述分析,讨论艺术家不同的视角与切身体验,使得在作品中的场所体现出不一样的表达,但作为景观的场所其内在的观赏性、征服
寒暑交替这一四时之变化,不仅影响人们的体感,更是关乎着人们的情感表现,从而影响人们的审美认知。古代山水画对四时之变,特别是对于单个季节的表现,都带有着深刻的意境表达。大自然千变万化,特别是春夏秋冬这一季节的轮替,更是万物的生长与消亡的自然推动力。不管是诗人还是画家,在自然界的这一消长与变动中,不能不为生命力的旺盛与生命凋零而感动。这种由景物带来的情绪感动,最终转化为一种诗情画意,形成了一种美好的意
本文通过举例分析中国仕女画和日本美人画中各个不同部分的色彩表现和产生这些差异性的原因来进行论述,根据自己在实践、探索,阅读理解的过程中所得的感悟来阐释自己的个人意见,探讨中日女性绘画的色彩表现的区别与联系。分段阐述中国仕女画和日本美人画在不同的历史阶段世人和画家所展现出来审美意识带来的色彩表现,并且两者之间在同根同源下经过时代背景和人文环境不断的更替所展现两者的联系。中国仕女画和日本美人画是画家寄
为缓解能源危机和减少二氧化碳(CO2)过量排放,发展新的技术手段重新再利用CO2这一丰富的碳资源成为各国的研究热点。其中,电催化CO2还原为高附加值的化学品被认为是非常有效的将CO2资源化和能源存储的技术途径。然而,电催化CO2还原具有高的热力学和动力学障碍,传统的贵金属材料(Ag、Au、Cu和Pd等)是电催化CO2还原的高效催化剂,但其高成本、低稳定性及污染环境等限制了它们大规模应用,在可替代贵
随着国内游戏产业的发展与硬件技术的提升,从八十年代起我国游戏产业开始逐渐摸索出自己的道路。在短时间内取得了一系列的成果。并在源头上对游戏制作环节进行整体的探索,逐渐重视技术与制作概念的创新,通过国内外优秀的游戏产品与制作概念交流,在目前的环境形势下,如何设计创作出具有中国特色与传承价值的游戏作品,并在外来游戏产品的强大实力下立足生存,是亟待解决的关键问题。本文试图研究水墨元素如何在游戏美术与制作环
新兴的物联网(Internet of Things,IoT)应用,如智能制造和智能家居,对提供低成本、高精度的室内定位和导航解决方案提出了巨大的需求。惯性测量单元(Inertial Measurement Unit,IMU)通常可以在较短的时间内提供较精确的位置解算,但是由于加速度计传感器存在测量误差的累积效应,其定位和导航误差随着时间的推移而迅速增加。另一方面,超宽带(Ultra-Wide Ba
艺术语言是创作者艺术表达的具体体现,能够代表创作的水平和画家的思想,版画创作中艺术语言的产生及演变是在众多因素共同作用下的结果。随着经济、政治等均实现了快速扩张发展,艺术、科学技术水平也在不断演进。新媒体、新文化以及新技术已融入到版画艺术里,使当代版画艺术不断呈现出新的表现语言与创作方法,给版画带来了新的机遇。在以往的版画展览中,某些传统版画的艺术语言较为局限,更新速度较慢,比较缺少与当代文化、当