复杂环境下基于深度学习的语音信号预处理方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jayleardutt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由深度学习引发的人工智能热潮正在影响和改变着人们的生活方式,人们不再满足单一文本、指令的人机交互,而是期待语音交互这种更加方便、快捷的交流方式。语音则成为其中不可或缺的信息媒介。然而语音在实际的传输过程中,背景噪声和人声干扰都会对语音造成一定的影响,使得语音的质量和可懂度下降,同时也给后续的应用带来挑战,比如语音识别、说话人识别等。在复杂的应用环境下,作为语音类应用的前端接口,语音信号预处理显得尤为重要,其可以细分出处理噪声干扰的语音增强和处理人声干扰的语音分离。语音增强是指语音信号被噪声干扰时,对噪声进行抑制,从混合信号中提取有用的语音信号的技术。一般的,语音增强所考虑的噪声类型是不涵盖类人声的干扰信号的。语音分离则是用来处理人声干扰的前端处理技术,旨在多说话人的场景下提取出目标说话人的语音信号而去除其他说话人的语音信号,应用场景如“鸡尾酒会问题”。对于语音增强任务来说,可分为传统语音增强算法和基于深度学习的语音增强算法。传统语音增强算法多是无监督的,通常需要对语音信号和噪声信号各自的特性及彼此之间的作用关系做出一定的假设。传统的无监督语音增强算法可以较好地处理平稳噪声,但是却难以处理非平稳噪声。近几年来,深度学习技术在多个领域得到了成功应用,也在语音增强领域得到了较多的关注和研究。早期研究发现,基于DNN(Deep Neural Network)的语音增强算法相较于传统语音增强算法可以取得很大的性能提升,尤其是在处理非平稳噪声的情况下。然而,基于DNN的有监督语音增强算法在实际应用中面对真实噪声场景、说话风格差异、低信噪比(Signal-to-NoiseRatio)时存在着推广性问题,如语音丢失、低可懂度等。针对这些问题,本文将围绕着训练数据构造、模型融合和新型模型结构设计来提升基于深度学习的语音增强算法在复杂的实际环境下的推广能力,着力解决低信噪比下的语音失真问题和对噪声类型的泛化问题。首先,在己有的DNN语音增强算法框架下,基于对低信噪比下训练数据的分析,利用语音端点检测(Voice Activity Detection,VAD)算法对训练数据进行处理,得到侧重点不同的两个DNN语音增强模型。测试阶段基于不同增强模型之间的互补性,通过VAD对两个DNN增强模型进行融合,来提升低信噪比下的语音增强性能,使得模型既能消除噪声又能保留必要的目标语音。其次,针对基于深度学习的语音增强模型的推广性问题,本文提出了全新的渐进式语音增强框架。该框架下的渐进式学习能够按照信噪比逐步递增的方式对语音增强问题进行分解,使得网络内部的功能得以明确,这有别于传统的“黑箱子”式的神经网络训练。在渐进式学习框架下,近一步提出密集连接的网络结构来提升模型的学习能力,使之能够训练出更深层、更好的语音增强模型。渐进式学习在DNN和长短时记忆网络(Long Short-Term Memory)两种网络结构中都取得了成功应用,提升了语音增强模型在实际应用场景下的推广能力。对于语音分离任务来说,也可分为传统的语音分离算法和基于深度学习的语音分离算法。传统的语音分离算法多是基于计算听觉场景分析(CASA),CASA是建立在听觉场景分析的感知理论基础上,利用聚类约束(grouping cue)如基音频率(pitch)等特征线索对同一说话人的语音进行追踪。基于深度学习的语音分离算法可以细分为说话人相关的语音分离和说话人无关的语音分离。基于深度学习的说话人相关模型具有较好的分离效果,本文在说话人相关的场景下研究噪声环境下的语音分离和目标说话人训练数据受限情况下的语音分离。首先,在噪声环境下,基于深度学习的说话人相关语音分离模型把噪声干扰和人声干扰统一看作是对目标语音的干扰,利用神经网络对二者联合建模处理,实验过程中发现两个干扰之间存在互补性。其次,针对目标说话人训练数据不足的应用场景,本文提出两阶段的语音分离方案来解决数据问题,并在CHiME-5比赛的真实数据上进行了实验验证。
其他文献
牛鼠药中毒每年发生的都不少,但真正能够解救成活的比例却很低,对中毒的牛可谓是几死一生.特别是一些不法之徒投药杀黄牛的事件时有发生的情况下,对我们兽医工作者在救治方面也提
紫花苜蓿以高产、优质、高蛋白质著称,有"草中之王、绿色黄金"之誉。是世界上广为栽培的优良牧草之一。紫花苜蓿具有广泛的生态适应性和生长稳定性,府谷县的气候土壤等环境条件
“风-水”联动智能控制系统针对轨道交通地下车站通风空调系统的运行特点,采用安全、可靠的节能技术,实现适应变负荷工况下整个通风空调系统的综合性能优化控制。深入浅出地
引入辽宁绒山羊,杂交改良陇东黑山羊,经过相关科技人员联合攻关和科学研究,培育出了适应华池当地自然条件下的陇东白绒山羊品种类群羊17659只,其产绒量公、母羊分别为528.36g
电力生产管理工作中会处理海量数据,如电力设备数据、电力设施数据、电力用户数据等,数据也会呈现出空间性、复杂性等相关特征。通过采用GIS技术设计电力生产管理系统,可以加
随着民航事业的快速发展,飞机的安全问题受到了越来越高的关注,而机务维修系统对保驾护航起着至关重要的作用。本文对民航维修系统中应用安全风险监测的具体措施进行了探讨。
生猪定点屠宰检疫,是一件利国利民的好事。特别是在放开生猪购销市场后,实行生猪定点屠宰检疫,有利于加强屠宰管理,控制疫情传播,制止病害肉上市,防止环境污染,保护国家税收,
【正】质量成本是近年来由于人们质量意识和效益观念的增强而发展起来的一种管理成本。对质量成本进行预测、控制、核算和分析也就是质量成本管理,是全面质量管理的重要组成
本文根据新型的智能配电终端调试服务及故障预警应用对移动平台的需求,提出了一种针对智能配电终端进行调试服务及故障预警分析的新思路,即利用搭载Android平台的手机APP,通
全民族抗战爆发后,以周恩来为书记的中共中央南方局坚持党中央提出的抗战、团结、进步的方针,最大限度的团结一切可以团结的力量,在文学艺术、新闻、教育、科技、卫生等多条