论文部分内容阅读
随着语音识别技术的深入研究和广泛应用,语音识别技术已基本成熟并逐渐应用于人们生活中的各个领域。本文对中小字表孤立词和连续词语音识别系统进行仿真,从而对提高正确分割率和识别率的算法进行探索。
本文按照一个特定人语音识别系统的处理过程,从信号预处理(数字采样、预加重滤波、加窗分帧)开始,分别介绍了语音信号的基础知识、实用化模型、端点检测、特征参数提取、语音训练和识别方法,并对每个步骤可用的几种方法进行了对比分析。其中本文对传统的连续词端点检测分割算法,进行了改进,成功地提高了分割正确率。最终,根据所选参数和语音分割识别算法编制了一个特定人小词汇量语音识别软件。论文具体的研究工作为:
第一,研究语音信号的预处理和特征参数提取。内容涉及了语音信号的数字化、加窗处理、预加重滤波、端点检测,及时域特征向量和变换域特征向量。
第二,研究特定人孤立词和连续词分割识别算法,包括基于能量和过零率的端点检测以及分割算法,DTW识别法,HMM识别法以及神经网络识别法。
第三,分析比较端点检测和分割结果,对传统的端点检测和分割算法进行了改进,并提出了一种利用短时能量的图像特征,根据图像的波峰波谷而进行语音分割的新算法。经实验证明在特定的背景要求下,该算法取得了比较好的正确分割率。
第四,设计并实现了一个特定人孤立词和连续词识别系统。进行了相关实验,对实验结果进行了讨论和分析。