论文部分内容阅读
随着人工智能的发展,语音识别、语音预测已经成为智能控制、个体识别、数据分析等重要应用的基础性工作之一。针对语音识别和预测问题,Volterra模型能够对时域和频域进行非线性系统分析,可以对非线性系统建模分析,综合使用线性和非线性的特点进行预测,近些年来受到广泛关注。Volterra模型作为级数函数展开式的应用,是一种描述系统输入输出关系的函数,能够从数学模型上逼近原混沌系统的特征,通常在实际的应用中,会将函数中的核函数进行相应的替换,利用替换后的核函数针对相应的非线性系统有良好的描述能力。传统的Volterra模型需要预先设置模型的参数,对于一些难以确定参数的语音时间序列需要进行大量的预处理工作过程繁复,至少需要得到序列的嵌入维和延迟时间。再通过手工设置,导入模型中。如果参数设置不当或者错误会造成Volterra模型核函数错误。其次,传统的Volterra模型在训练过程中,如果语音时间序列的嵌入维数过大,会引起核函数个数过多,而影响因素较小的参数会始终参与模型的运算造成大量的不必要的系数运算,导致Volterra模型的参数不能够更新或者更新缓慢造成维数灾难。传统的Volterra模型在模型构建过程中不能够显式地展示出模型的结构,不能够分析出影响比较大的核函数系数。传统的Volterra模型在构建模型过程中搜索速度比一般模型较快,但是存在全局搜索能力和搜索精度不高的缺点。本文根据目前遇到的问题,对传统的Volterra函数进行了改进,提出了一种基于隐相空间重构的混沌语音信号非线性预测模型。(1)为了克服传统Volterra模型运行效率低,需要大量复杂的预处理的情况,本文提出了基于隐相空间重构的二阶Volterra模型,模型在构造过程中,避免了传统方法中需要相空间重构的过程,将相空间重构过程隐含于语音时间序列SOVF模型求解过程之中,在算法求解模型系数过程中求得最优的嵌入维和延迟时间,不需要再预先设置模型中样本的基本参数,加强了模型的自适应性,提高了算法的运行效率。(2)针对原始Volterra模型求解算法更新速度慢以及全局搜索能力不足、搜索精度不高,无法跳出局部最优值的情况。本文引入改进的耗散粒子群算法求解模型系数,利用改进的耗散粒子群算法不仅可以避免模型陷入局部最优值,而且改进之后的耗散粒子群算法在算法的整个运行过程中始终保持较高的耗散率,增加了运行效率;本文采用英语音素、单词为实验样本数据,建立了基于动态均匀搜索粒子群优化算法的二阶Volterra语音预测模型。(3)为了降低模型复杂度,在误差允许范围内对Volterra模型进行关键项的提取,减少了参数个数,构建了优化后的语音预测模型。实验分析结果表明:基于隐相空间重构的模型与改进的耗散粒子群算法相结合所进行的混沌语音时间序列预测,对于语音信号的单帧与多帧预测相比于线性模型有较好的精度,并且预测性能与基本耗散粒子群算法与Volterra模型相比较也有进一步的提升,在语音预测的波形,在语音质量、语音评价上也有进一步的提升,完全可以满足语音预测的要求。本文所提出的混沌语音信号的改进模型以及将模型与改进的耗散粒子群算法相结合的做法,为语音信号的预测提出了新的思路,可以被用于复杂语音时间序列的预测。