论文部分内容阅读
语音基频是语音信号中比较重要的特征信息,主要应用到语音合成系统和声纹识别系统。目前,语音基频检测算法的研究一直是研究的重点和难点,并且现有的语音基频检测算法都是估计算法,对于纯净语音信号来说,其准确性较好,但对于噪声环境下的语音信号,其准确性仍有待提高。因此,本文采用谱减法、自适应滤波法、自相关函数法和平均幅度差函数法来解决噪声环境下语音基频检测算法准确性低的问题。首先分析了语音信号的产生流程与数学模型,对语音信号基音频率的数学模型进行研究,分析语音基频的特性,建立相应的语音库,对语音信号的预处理各个流程进行分析,并且通过大量的仿真实验确定语音预加重、分帧、加窗、端点检测所使用的方法。对语音增强基本理论和算法进行研究,并且指出谱减算法在语音增强实际应用中存在的问题,使用自适应滤波算法对谱减算法进行改进,提出了后置自适应滤波器谱减算法。后置自适应滤波器谱减算法不仅解决了使用谱减算法过程中残留的“音乐噪声”问题,并且输出更高信噪比的语音信号,同时,后置自适应滤波器谱减算法也适用于噪声环境下的语音增强。本文对语音基频检测算法中的自相关函数法(Auto Correlation Function,ACF)和平均幅度差函数法(Average Magnitude Different Function,AMDF)进行仿真实现,并且指出它们在实际应用中存在的问题。使用自相关函数法和平均幅度差函数法相结合进行算法的改进,改进的算法增大了基音周期的边界点的峰值,提高了基音周期判断的准确性,进一步提高了语音基频检测算法的准确性。改进的语音基频检测算法保留了自相关函数法和平均幅度差函数法的优点,并且在算法流程中使用了带通滤波器、中心削波算法和平滑滤波算法,降低了部分共振峰、倍频和半频、野点的干扰。为了验证改进的语音基频检测算法在噪声环境下语音基频检测的有效性和准确性,采用含有噪声背景的语音库数据集进行语音基频检测算法验证,统计语音基频检测算法的错误率参数PTE、UE、VE。对于含有babble噪声语音库数据集来说,改进的语音基频检测算法的PTE相对于自相关函数法和平均幅度差函数法分别减少了 6.50%和11.89%,对于含有pink噪声、factory 1噪声、white噪声语音库数据集来说,改进的语音基频检测算法的错误率都小于自相关函数法和平均幅度差函数法的错误率,结果表明在噪声环境下,改进的语音基频检测算法准确性要高于自相关函数法和平均幅度差函数法,并且改进的语音基频检测算法可以对真实环境下的语音基频进行检测。