【摘 要】
:
语音交流是人们生产生活中进行信息传递的重要手段之一。在信息传递过程中,语音信号不可避免的会被各种噪声所干扰,使其存在不同程度的信息丢失。为尽可能还原被噪声污染语音信息,降低语音信息在传递过程中的损失,提升语音的可懂度和清晰度,语音增强技术被提出并广泛应用于军事通信、电话会议等场景中。作为语音信号处理的第一步,语音增强效果将直接影响通信质量。然而,现有的语音增强技术存在低信噪比环境中增强效果不佳、模
论文部分内容阅读
语音交流是人们生产生活中进行信息传递的重要手段之一。在信息传递过程中,语音信号不可避免的会被各种噪声所干扰,使其存在不同程度的信息丢失。为尽可能还原被噪声污染语音信息,降低语音信息在传递过程中的损失,提升语音的可懂度和清晰度,语音增强技术被提出并广泛应用于军事通信、电话会议等场景中。作为语音信号处理的第一步,语音增强效果将直接影响通信质量。然而,现有的语音增强技术存在低信噪比环境中增强效果不佳、模型泛化能力不强等问题。针对此类问题,目前基于神经网络的语音增强模型多采用增加网络的深度、改进损失函数等方法提升网络性能。基于此,本文提出一种基于多尺度生成对抗网络的语音增强模型。该模型在低信噪比环境中依然具有较强的降噪能力和泛化能力,并且相比于原始基于生成对抗网络的语音增强模型,该模型在生成器中生成多个维度的语音信号,并可以在多个子判别器中进行判别,从多个维度来对语音信号进行增强,强化模型在低信噪比环境中语音增强的效果。本文的主要研究工作及创新点如下:(1)详细介绍了基于生成对抗网络的语音增强算法原理,对谱减法、基于MMSE最优改进对数谱幅度估计算法和基于生成对抗网络的语音增强方法进行仿真实验,分析不同算法目前存在的问题和优势。(2)提出一个多尺度生成器和判别器体系的全新结构,来解决原始的基于生成对抗网络的语音增强算法对抗性训练不稳定,在低信噪比环境中降噪性能不佳等问题。该算法能够从不同的维度对语音进行增强处理,进而提升整体的语音增强效果。实验数据表明,该算法和原始生成对抗网络语音增强算法、传统算法对比,取得了更高的客观评分,尤其在低信噪比情况下语音增强效果提升最为明显。(3)为解决网络对语音信息利用不充分的问题,同时减少生成语音时信息的流失,在模型中添加下采样跳变连接,并通过实验仿真对比得出最佳跳变连接组合。为提升网络最终输出语音的增强效果,我们增加原始维度生成语音信号的权重比,使网络从多维度进行语音降噪的同时,侧重于原始维度增强语音的生成。(4)将基于MMSE最优改进对数谱幅度估计算法作为预处理步骤,和基于多尺度生成对抗网络的语音增强模型相结合,形成联合语音增强算法。预处理步骤可以减轻噪声对多尺度生成对抗网络的干扰,提高语音信号的可懂度和信噪比,为多尺度生成对抗网络提供更多有效特征。
其他文献
强流脉冲电子束(HCPEB)表面改性处理是近二十多年发展起来的一种表面改性技术,已有研究表明该技术对金属材料的表面耐磨性能和耐蚀性能有着明显的提升。本文选择两种镁合金Mg-4
近年来,随着中国经济的多元化发展和国家鼓励中小企业发展战略的实施,小企业之间的合作现象日益增多,小企业间以社会网络达成商业合作链接,形成了新型的合作伙伴关系。在学术界,越来越多的学者开始关注旅游小企业社会网络对企业绩效的影响。他们越来越重视在旅游小企业研究中社会网络和关系嵌入的应用,并取得了令人瞩目的研究进展。然而,以往研究较少考察到旅游小企业的社会网络对企业绩效产生影响的具体作用机制。本研究以社
随着现代工业的发展,水中铬离子(Ⅲ)的污染也越来越严重。大量的铬离子(Ⅲ)不仅对生态环境造成了危害,而且威胁着人类的健康,铬离子(Ⅲ)的污染越来越受到人们的重视。吸附法是常用的处理水中铬离子(Ⅲ)污染的方法。SBA-15分子筛,因其比表面积大,拥有高度有序的孔道,良好的水热稳定性和化学稳定性,且孔径大小可调,是吸附水中铬离子(Ⅲ)的理想吸附剂。但是纯硅系的SBA-15分子筛缺少活性基团,对水中铬离
问题导学课堂模式是以问题为主线,学生为主体,提倡在教学中发挥教师在课堂中的引导作用的教育模式。与传统教学模式不同,问题导学模式倡导“以学生的学”来制定“老师的教”。多年以来,在实践中较为成功的实施此模式的有“杜郎口”中学、“洋思”中学等。2011年开始,图们市开始教学改革之路,将问题导学模式推广到中小学义务教育阶段,经过多年的实践与研究,问题导学模式渐渐地融入到图们市的教育教学当中,在教师的不断努
随着信息时代的到来,为保护芯片中的信息安全以及防止芯片自身所携带的高新技术不被他人再利用或再研发,可自毁电子器件已经成为了研究的热点。本论文设计了一种基于MEMS工艺的自毁器件,采用机电触发、化学腐蚀的方式实现硅基微结构的完全自毁。分别对自毁器件中的MEMS隔离膜、MEMS冲击锤、静电驱动结构和静电锁止结构进行理论分析和结构优化,并设计了加工工艺流程和版图。本论文的主要研究内容如下:对MEMS隔离
精确制导武器在现代战争中发挥着重要的作用。而红外制导一直以来都是精确制导武器的主要制导方式之一。目标检测算法则是红外制导系统中的关键环节。随着军事科技的日益进步,深度学习与红外目标检测算法的结合已经成为下一代人工智能武器的重要研究方向。数据是深度学习的重要基础,任何深度学习算法都离不开数据。数据集的数量和质量将直接影响到深度学习算法的性能。然而由于军事目标的敏感性,很难获得足够数量的公开数据集对军
为了解决由于人口老龄化、交通事故等原因造成的失能人士护理问题,设计和研发能够提供康复护理和生理状况监测功能的医疗设备显得尤为重要。生命体征参数的实时测量能够及时
超声振动钻削是一种新兴的复合微孔加工方法,它将普通钻削的旋转运动与超声振动两种运动相结合,使得切削用量产生规律性的周期性改变,实现了钻头脉冲式断续切削加工,从本质上
近年来云计算不断发展,针对虚拟主机的入侵也越来越多,传统的网络安全措施难以适应云环境安全检测需求。为了解决云环境下的网络安全问题,研究者们提出了基于机器学习的云环境异常检测技术。在机器学习算法中,BP神经网络、K-Means、SVM等算法被广泛应用于异常检测,但是这些算法复杂度高,模型泛化能力弱,数据量较大时检测时间较长。随机森林是集成学习Bagging思想的典型应用,每个弱学习器给出一个分类结果
课堂教学是学校教师最主要的教学方式,是学生获得知识的主要途径,而确保学生按时上课是提高教学质量的关键。课堂考勤制度是有效制约学生按时上课学习、完成学业要求的管理方法,在许多高校管理中,将学生的课堂考勤表现作为课程成绩评价的重要组成部分,突出了课堂考勤的重要性。然而经常发生的旷课现象不仅严重影响了学校的教学秩序,而且还阻碍了大学生获得专业知识和技能以及提高综合能力的途径。针对当前常用的考勤方式,比如