论文部分内容阅读
基音频率作为语音信号的重要参数之一,它的精确提取对于高质量的语音分析合成、语音压缩编码、语音识别及说话人确认等方面都具有很重要的意义。本文在对传统算法进行深入研究的基础上,给出了两种准确性和鲁棒性都相对较高的基音检测算法,并将基音频率作为特征参量应用于方言辨识系统。论文的研究工作和成果有如下几个方面:(1)对目前国内外几种典型的基音检测算法进行了阐述与分析,并通过仿真实验,对不同算法进行了比较和评价。(2)提出一种清浊音分类与多带激励(MBE)自相关法相结合的基音检测算法。该方法采用多参数高斯混合模型对语音信号的清浊音进行判决,对浊音信号采用多带激励自相关法进行基音检测。实验证明,该方法与传统自相关法相比,提高了清、浊音判决率,特别是在清、浊音过渡音段,有效改善了语音的基音轨迹。(3)提出了一种将预测神经元模型与LP-CEP相结合的基音检测算法。实验结果表明:该算法无论对纯净语音,还是对低信噪比情况下的含噪语音,其基音检测效果都明显优于传统倒谱基音检测算法。(4)建立了基于SOM神经网络和支持向量机(SVM)的汉语方言辨识系统。该系统以湖南方言作为研究对象,借助SOM神经网络对不同方言的基音频率进行聚类,并用SVM作为最终的决策辨识器。实验结果表明:该系统实时性和辨识率较好,可适用于信噪比低的情况。