论文部分内容阅读
随着网络的发展,网络音频业务得到了广泛的应用。网络音频的发展离不开编码器的支持。3GPP提供的第四代全新语音频编解码器EVS(Enhanced Voice Services)凭借其优良的性能目前已广泛应用于不同的场景。然而EVS音频质量在实际应用场景中会受到很多因素的影响,为保证给终端用户提供可靠的音频质量,需要对其质量进行评价,并根据评估结果来调节编码和网络参数,从而保证用户体验。因此,研究EVS编码标准的音频质量具有重要应用价值。为了分析网络音频压缩和传输过程中各因素对语音质量的影响,本文构建了网络音频实时传输系统,该系统实现对音频信号编码、网络传输以及解码等多种功能,可以根据需要设置不同的编码参数和网络参数。该系统可以应用于本论文后续对影响网络音频质量的失真因素的分析。针对背景噪声、编码压缩以及网络丢包等因素对网络语音通话质量的影响,本文提出一种考虑背景噪声的EVS语音质量评估模型。该模型首先对IP数据包解包解码获取语音信号,并分析语音信号的时域包络,提取包络的频谱特征,根据特征参数估计受到背景噪声影响的语音质量;在此基础上,分析背景噪声影响的语音质量和编码速率与编码质量之间的关系,预测语音编码质量;最后,在获取编码质量的基础上,分析编码质量和丢包率与网络语音质量的影响,预测最终的语音质量。实验结果表明,本文提出的考虑背景噪声的EVS语音质量评估模型可以较准确的预测EVS语音质量。为分析不同音频类型(语音和音乐)对编码质量的影响,本文提出一种基于音频类型分类的包层音频编码失真评估模型。模型首先通过分析包头信息获取数据包的编码速率;然后通过检测数据包大小对接收的数据进行音频类型分类;最后分析编码速率和不同音频类型(语音和音乐)与编码质量的关系,估计EVS音频流的编码质量。实验结果表明,本文提出的编码质量评估方法其评估结果与主观质量评估结果有很好的一致性。