论文部分内容阅读
语音增强旨在提高因噪声导致衰减的人声语音的清晰度,可懂度。虽然基于深度学习技术的神经网络模型,在语音增强应用中效果显著。但其大多因使用基于时域波形之间的均方差(Mean Square Error, MSE)损失函数,而受到一定的性能限制。本文提出一种基于多损失值融合神经网络的语音增强模型,使用语音生成对抗神经网络,作为人类听觉感知指标,构建出与人类听觉感知有关联的多损失值损失函数,进行语音增强。