论文部分内容阅读
语音识别技术已经深入人类生活和工作的各个方面,加强语音识别技术的研究,提高语音识别的实用性,对改善人类生活具有重要意义。本文对汉语语音识别技术进行研究,包括噪声环境下的汉语语音切分、预处理、特征提取及语音识别算法。鉴于经验模态分解、Teager能量和熵能够突出体现信号的幅度和频率变化,并且具有噪声鲁棒性的特性,本文将三者结合实现噪声环境下的汉语语音切分。首先进行经验模态分解,滤除噪声,然后对分解出来的固有模态函数计算Teager能量熵,最后通过双门限切分法找出切分点。仿真实验表明该方法切分准确,对噪声具有较强的鲁棒性,并且能够以音节为单位切分汉字,适应汉语语音一个音节表示一个汉字的特点,为汉语语音识别打下基础。为提高汉语语音识别准确率,充分利用矢量量化的压缩特性和隐马尔可夫双重随机过程的语音模型优势,设计一个基于隐马尔可夫和矢量量化的汉语语音识别决策系统,完成语音识别。针对矢量量化中的经典算法--LBG算法容易陷入局部最小解,而且依赖于初始码书选取的缺陷,提出群智能优化矢量量化法的语音识别算法,寻找更加接近全局最优的码书,本文主要开展基于猫群优化矢量量化法的研究,并在仿真实验中实现了猫群、粒子群、蚁群等群智能优化矢量量化方法,提高了语音识别率。通过对汉语语音识别技术的研究,在MATLAB平台上实现了一个小词汇量汉语语音识别系统,验证了新切分算法的噪声鲁棒性和切分准确性,以及改进识别算法的识别准确性。