论文部分内容阅读
语音识别是一门交叉学科,它与语音学、语言学、数字信号处理、模式识别、最优化理论、计算机科学等众多学科紧密相连,是一门既有理论价值又有实际意义的学科。语音识别发展了几十年,取得了很大的进步。语音识别在某些方面还是存在一些问题:如对自然语言的识别和理解还属于初级阶段;语音信息量大不易存储;语音的模糊性;单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等;环境噪声和其它干扰对语音识别有严重影响,致使识别率低。因此,解决以上问题是语音识别发展的重点。
本研究主要内容包括:第一,简单介绍语音识别基础知识和语音识别的国内外发展状况以及文章的整个结构划分。第二,在语音信号处理过程中,一方面在时域和频域中对语音信号进行分析,分析出语音信号的参数;另一方面利用传统的小波阈值函数对语音信号进行去噪,效率低,而且效果不好,本文结合了小波软硬阈值的优点,改进了小波的阈值系数,利用改进后的小波对采集的语音信号进行处理,效果有了明显的提高。本文结合语音信号的数学模型以及语音信号的本身特征,提取出了语音信号的特征参数。第三,本文的重点是以DTW和HMM等识别算法为基础,对这两种算法提出了改进。对DTW算法的改进主要体现在:在数据帧的两端开放δ帧的自由,缩短帧与帧之间的距离,提出声刺激法:对HMM算法的改进主要体现在:改进HMM模型的分类和统计能力,原始的HMM模型不能很好地表现语音信号的时域特性,改进后的HMM模型基本上能体现语音信号的时域特性,解决原始HMM模型不能解决的语音信号的下溢问题。第四,根据语音识别的具体方法,基于改进的小波去噪、改进的DTW和改进的HMM算法。我们首先在MATLAB软件中进行特定人语音识别的仿真试验;其次,在VC编程环境中实现了特定人语音识别和连续语音识别系统,在处理语音信号和识别方面都获得了成功。最后,我们对小型语音识别系统进行试验验证,采用改进后小波阈值去噪以及改进后的DTW和HMM算法,在不同条件下测试语音识别率和稳定性,结果都有了很大的改善。