论文部分内容阅读
语音识别在当下是研究的热点,语音识别是涉及语音语言学、计算机科学、信号处理、生理学、心理学等众多学科的一门交叉学科,也是模式识别和人工智能领域的重要分支,然而藏语语音识别的研究却相当滞后,本文主要介绍藏语的单音节预处理和特征提取的方法。预处理过程在语音识别中起着至关重要的作用。对于藏语语音识别的预处理研究借鉴的是英语单音节的语音处理方法,在语音识别系统中正确的判定输入语音的起点、终点对于提高识别率是非常重要的。对于短时瞬态信号、非平稳过程信号、含宽带噪声信号采用传统方法处理有着明显的局限性,在高信噪比情况下,滤除噪声是很容易的,用短时能量幅度与短时平均过零率可以获得较好的检测结果。首先总结一下倒谱特征参数的优点,倒谱特征参数不仅可以体现原始信号的特征,而且对于谐波或者噪声几乎可以有很明显的区分,具有很好的鲁棒性和稳定性,所以现在的语音识别几乎都是用的倒谱来实现的。在语音识别系统中用倒谱是比较有优势的。这篇文章采用几种方法的综合处理可以准确率较高的确认识别语音的端点,并能在低信噪比情况下滤除噪声,识别清浊音。实验证明了此种方法不仅正确,而且提高了检测的准确度。特征提取是尽可能的保留那些对识别有效的信息,同时最大限度的去除哪些无用的、冗余的信息。由于语音处理技术在很多方面都有要运用,而且在语音识别系统中,最关键的是语音特征参数的提取。做语音识别时,最后的识别结果与预处理有关,更重要的是信号的特征参数,它直接决定识别结果。在语音信号处理中,语音信号特征提取是非常重要的。本文开始对基本知识做了认真的研究,主要是在语音信号处理,语音识别技术,还有最基本的原理。对于LPCC来说,特征参数跟背景噪声有很大的关系,因为线性预测倒谱对噪声的相应是非常敏感的,梅尔倒谱系数就不受噪声的影响。自然对于本文来说,为了更具说服力,我们对含有噪声的语音信号进行研究处理。因为在较短的时间间隔中,语音信号的时域特征可基本保持不变,这是研究语音信号能有成果的基础,本文利用梅尔倒谱系数对单音节藏语进行特征提取。