论文部分内容阅读
语音识别由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。到目前为止,语音识别研究大部分以线性系统理论为基础,随着研究的逐步深入,发现语音识别若要取得突破,必须引入非线性理论的方法。从20世纪80年代开始,随着人工神经网等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。RBF(Radial Basis Function, RBF)神经网络为多层前馈式神经网络的学习提供了一种新颖而有效的手段,它的研究和应用在近年来得到了迅速的发展。本文基于RBF神经网络,对语音识别的预处理、特征提取与识别算法等环节进行了计算验证,性能分析和结果评述。基本的RBF神经网络是一种三层前馈网络,其收敛速度大大高于一般的BP网络,且网络拓扑可以在算法中确定。设计中存在的主要问题包括隐层神经元数、中心和半径的确定,以及网络权值的训练。本文采用的网络构建方法为:采用竞争算法和聚类算法相结合的混合算法动态选择隐层神经元数;用梯度下降法找出使代价函数最小的权值参数;从节省资源的角度出发,本文采用了Akaike的最终预报误差标准FPE删除那些对网络输出贡献较小的节点以取得网络精度与复杂度的平衡,直至FPE不再下降,停止筛选并计算网络最优权值,从而得到了一个合理的网络。另外还实现常用的迭代法、随机固定法训练的径向基网络结构和概率神经网络结构。文中用双门限法端点检测后用Mel频率倒谱系数MFCC提取语音特征参数,动态时间规整后输入构建好的RBF网络结构,用训练数据进行学习网络,网络训练完毕后将测试样本输入已训练的网络进行识别。对语音库中的纯净语音和带噪语音识别结果显示,改进后的RBF网络在识别率和识别速度上都有了显著提高。