论文部分内容阅读
语音情感识别是情感识别的一个重要分支,它利用计算机及其辅助设备提取说话人的情感特征,分析说话人的情感状态及其变化,进而确定说话人的心理情绪或思想活动,实现人机之间更自然、更智能化的交互。目前,特定人语音情感识别研究已经取得了巨大的成就,特别是在远程教育、医疗、通信、刑事侦查等方面已经得到大量应用;但现实世界中,非特定人语音情感识别的应用领域更加普遍,故针对非特定人的语音情感识别研究具有更大的现实意义。本文正是针对非特定人语音情感识别过程中识别模型对待识别样本的适应性问题,提出改进方法,并通过实验进行有效性验证。论文主要工作如下:
(1)提出基于错分样本近邻支持向量优选的语音情感自适应识别算法。该算法用语音情感训练集样本训练的初始模型对新增的语音情感样本进行识别,把被识别错误的语音情感样本作为自适应样本,与对其进行识别的模型中的近邻支持向量一起构建自适应训练集,根据C-SVM模型参数拉格朗日乘子总和保持不变的原则,通过SMO算法调整模型的支持向量和对应的拉格朗日乘子,从而提高模型的泛化性能。
(2)提出基于特征分组的多核融合语音情感自适应识别算法。此算法首先把语音情感特征按照待识别样本集的特性分为若干组,然后根据各组特征的特性采用不同的核函数训练C-SVM模型,并分别把各个模型支持向量间的相似度作为其权重系数,通过自适应样本不断调整权重系数和模型参数,使得C-SVM模型的参数能够随着待识别语音情感样本特性的变化而自适应地变化。这种特征集与核函数相匹配的方法最大程度的利用了不同特征的特性和不同核函数的优点,使得模型的识别性能进一步提高。
(3)采用Matlab和VC++结合的开发模式,实现了非特定人语音情感识别原型系统。其中语音信号的读取和处理以及情感特征的提取均采用Matlab编写代码实现,模型训练、情感识别功能用VC++编写代码实现。最后,通过与其它算法实验结果的对比和分析,证明了本文算法的有效性和稳定性。