论文部分内容阅读
近年来,随着人们对人机交互兴趣的增加,情感识别逐渐成为一个研究热点。语音情感识别是指利用计算机分析特定说话人的情感状态及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动心理学等学科的发展,有着重要的现实意义,并最终产生很大的经济效益和社会效益。本文首先综述课题的研究背景,并分析目前国内外已提出的语音情感特征的提取、特征选择以及语音情感识别方法。在此基础上,提出了基于神经网络贡献分析的特征选择算法、基于误识率的情感类别混淆度计算方法和基于选择性特征的SVM决策树算法。具体内容如下:(1)基于神经网络贡献分析的特征选择算法。由于语音情感特征参数较多,存在无关特征和冗余特征。本文提出了基于神经网络贡献分析的语音情感特征选择方法,以此来减少冗余信息的影响,同时也降低了计算量,提高了识别速度。该方法将从时间构造、振幅构造、基音构造、共振峰构造、MFCC系数以及Mel频谱能量动态系数上提取的101个语音情感特征,通过神经网络贡献分析进行选择,同时采用聚类性分析对经过选择后的情感特征进行有效性分析,以此来验证所选择特征的有效性。(2)基于误识率的情感类别混淆度计算方法。在情感类别中,某些情感状态较为相似,难以区分,而某些情感状态差别较大,比较容易对它们进行分类。该方法通过SVM一对一算法得出情感间的误识率,根据误识率计算出情感间的混淆度,并提出组间混淆度的概念。通过计算情感状态之间的混淆度以及组间混淆度完成对情感类别的分组,保证将容易混淆的情感类别归为一组,以便进一步考察组内的情感类别细微差异。(3)基于选择性特征的SVM决策树语音情感识别方法。该方法针对不同语音情感特征对不同语音情感类别的贡献存在差异的特点,根据神经网络贡献分析法选择出对每种情感状态贡献比较大的情感特征。同时,根据类间混淆度,将容易混淆的情感归为一组,建立SVM决策树中间节点,对每组情感采用其各自的贡献较大的特征进行分类。此外,对每一情感语句只需提取六类情感状态贡献较大的情感特征的并集的特征,以此来降低计算量,提高识别速度。(4)采用Matlab和VC结合的开发模式,设计实现了基于选择性特征的SVM决策树语音情感识别原型系统,从实验角度验证了上述方法的有效性。