面向在线会议应用的语音去噪关键技术研究

来源 :张梓佳 | 被引量 : 0次 | 上传用户:ydy448681577
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后疫情时代的到来,在线会议应用成为人与人沟通必不可少的工具,然而开会人员所处环境的噪声会严重影响会议质量。因此,对会议应用中的输入语音进行实时去噪具有重要的研究意义和应用价值。目前已有的语音去噪算法主要存在以下问题:复杂的语音去噪模型不能对语音进行实时去噪,而基于卷积神经网络的实时去噪模型受限于感受野的大小,无法充分利用语音序列数据的全局信息;其次,一般的语音去噪模型局限于对环境噪声的消除,不能较好地处理语音中的人声噪声。本文从上述问题出发,提出一种实时语音去噪方案,先通过语音增强模型消除语音中的环境噪声,然后通过目标说话人提取模型消除语音中的人声噪声,并将处理后的语音实时返回。本文的研究内容包括:(1)提出一种基于GLU和形变GRU的语音增强算法MG-Wave UNet。通过将GLU引入卷积块中,提升模型对语音序列数据的建模能力。同时本文针对会议噪声的特点,使用Mog GRU模块充当模型的中间层,以进一步提升模型对语音序列数据上下文信息的提取能力。实验结果表明该模型的语音增强性能明显优于其他语音增强模型;(2)提出一种基于注意力机制和RRM机制的目标说话人提取算法SF-SNet。通过引入SF模块,提升模型中说话人提取器模块的提取性能,同时本文还针对即时提取机制的缺点提出RRM机制,以提升目标说话人提取模型的鲁棒性。实验表明,与其他的目标说话人提取模型相比,使用该模型提取目标说话人的语音在语音质量和尺度不变信噪比等评估指标上的得分均有明显提高。基于上述研究,本文提出一套实时语音去噪服务,并使用真实会议场景下的语音数据进行测试。测试结果表明实时语音去噪服务能够明显消除语音中的环境噪声和人声噪声,提高语音质量。
其他文献
中小学的教学活动,随着我国社会及教育的发展,对教学区的空间提出了更高的要求,主要体现在教学区各功能的高效连通以及教学区各类型空间的种类及品质两个方面,本文将此两个方面总结为中小学教学空间的“高效性”。增强中小学教学区空间的高效性对教学区空间适应当下教学活动,提高中小学教学质量具有重要的意义。空间句法出现于20世纪70年代,因科学的研究方式,在建筑、规划领域空间研究中有广泛的应用,空间的整合度被验证
学位
《中国音乐美学史》(修订版)于2003年出版,是蔡仲德先生为中国音乐美学史课程编著的教材。文章讨论了该书的研究特色,并结合当下中国音乐美学史发展现状进行了思考与阐发。该书贯穿了蔡仲德先生关于中国音乐美学史中的主要思潮与基本问题。此外,作者还从科研方面探讨分析了蔡先生“文如其人,人如其文”的学术思想。
期刊
静脉输液作为一种重要的给药治疗途径,目前依然以人工监护为主,而该监护方式存在护理负担大、安全性低和管理效率低等问题,特别是新冠疫情爆发期间,该问题显得尤为突出。针对这一问题,本文设计了一种基于“互联网+”的医用智能辅助输液系统,旨在减轻监护者的护理负担、提高输液治疗的安全性和管理效率。首先,对“互联网+”智能输液及输液监测方法的研究现状进行了调研分析,总结出亟需解决的问题,确定了系统设计目标和总体
学位
水声传感网是探索水下世界的有效工具,在资源勘探、灾害预警、水下导航等应用场景中发挥着重要作用。目前,数据采集是水声传感网的主要工作,网络中的传感器节点致力于将水下的数据汇聚于水面的浮标节点,在这过程中,水下节点由于只能由电池供电,工作寿命十分有限。在复杂多变的水下环境中如何实现高效节能的数据传输方法是当下的研究热点。媒体接入控制(Medium Access Control,MAC)协议是水声传感网
学位
目的 分析保妇康栓联合心理干预治疗宫颈炎合并人乳头瘤病毒(human papilloma virus,HPV)感染的有效性及对患者负面情绪的影响。方法 入组研究对象是2019年4月~2021年4月本院120例宫颈炎合并HPV感染患者,分组依照随机法(每组60例),对比组接受保妇康治疗,病例组接受保妇康栓联合心理干预治疗;对比两组临床疗效,以及不同年龄段、不同病情阶段、不同居住地、不同文化程度患者汉
期刊
波浪在近海岸结构物上的爬高是近海监测中一个非常重要的参数,是海堤的修建以及海岸侵蚀预测等相关研究领域的重要参考依据。波浪爬高的传统研究形式以物理实验为主,其会耗费大量的时间、人力与物力。随着无人机系统以及计算机技术的发展,对现场测量与计算机数值模拟带来了极大的便利,这也成为了现在的研究热点。综上所述,本文基于机载LIDAR系统并联合计算机数值模拟来研究波浪爬高具有重大的意义。本文分别从图像的边缘检
学位
作为火麻籽榨取火麻油之后的副产物,火麻籽粕具有成本低廉、蛋白质含量高和氨基酸组成丰富的特点,有作为人类蛋白质营养补充剂和功能食品原料的潜在价值。本文研究了火麻籽粕蛋白的提取工艺、功能特性和消化特性,优化了酶法制备具备α-葡萄糖苷酶抑制活性酶解产物的工艺,并阐明了酶解产物的理化性质、抗氧化活性、抑制机理及加工和消化稳定性。对酶解产物中的活性肽进行分离纯化、鉴定、虚拟筛选和合成验证。考察了酶解产物对C
学位
5G毫米波的频段(24.5-29.5GHz)频率高、绝对宽带宽,具有大容量、高速率、低时延的优势,因此受到广泛的关注和研究。随着5G毫米波通信的发展,移动通信设备往高度集成方向发展,对天线的尺寸提出了更高的要求,封装天线顺应潮流成为目前毫米波无线系统的主流解决方案。由于5G终端(如手机)特殊的应用场景,对毫米波天线有高增益、低剖面、高效率、宽带(覆盖5G毫米波频段)等特殊要求,因此针对这些要求开展
学位
在无线通信系统中,射频收发模块起着重要作用,锁相环作为射频收发模块的重要组成部分,为射频收发模块提供本振信号,它的相位噪声对通信质量至关重要。鉴频鉴相器(Phase-Frequency Detector,PFD)、电荷泵(Charge Pump,CP)和压控振荡器(Voltage-Controlled Oscillator,VCO)是锁相环的主要组成部分,对它的锁定时间,相位噪声,频率调谐范围等起
学位
自然采光是教室物理性能的重要评价指标,对于保护学生视觉健康和提升学习效率有着重要的意义。相比于人工光源,良好的自然采光设计可以提高室内空间的视觉舒适度,从而有效提升使用者的学习和工作积极性。教室是大学生上课和自习的主要场所,其自然采光设计至关重要。然而在方案阶段建筑师往往仅能依据窗地比指标和自身经验来初步决定采光设计,容易导致实际值与预期值间存在较大误差。随着人们对教室采光品质的要求逐步提高,过往
学位