论文部分内容阅读
在智能人-机交互系统中,语音情感识别是目前的研究热点之一,支持向量机(Support Vector Machine,SVM)方法被广泛用于语音情感识别。然而,它是一种二元分类方法,当情感混淆度较大时,不仅需要构造多元分类器,并且在分类过程中存在着一些不可分区域,使用传统SVM作为分类器会影响分类结果。现实生活中许多分类问题具有高度不平衡特性,当数据集中的正负样本不平衡性较大时,传统支持向量机对噪声和孤立点比较敏感,对少数类的识别效果较差,因此本文提出新的隶属度函数设计方法,针对传统模糊支持向量机存在分类敏感和对支持向量赋予隶属度值不够精确等问题进行改进,并用于语音情感识别。主要研究内容有以下方面:(1)介绍了有关于统计学习理论前景和基于统计学习理论SVM算法的原理,详细描述了实现过程,同时引出了模糊支持向量机(Fuzzy Support Vector Machine,FSVM)的概念,给出了模糊支持向量机模型中涉及到的模糊数学中相关定义及定理。(2)特征参数方面研究了单特征及特征融合对识别网络所产生的影响,通过实验验证选取了最优特征融合方式研究基于模糊支持向量机算法的语音情感识别方法,本方法通过将模糊理论结合支持向量,提高支持向量机方法的学习及泛化能力,解决非线性、小样本以及高维模式识别的问题,有效减少野值和噪声点带来的影响,提高了对情感语音的分类精度。(3)通过研究现有的FSVM算法,在原理方面对其进行改进,设计新的样本赋予权值方式,提出了一种新的基于类内超平面距离度量的隶属度函数,以实现有效突出支持向量并减弱噪点的作用,并对每个样本点进行精确权值赋予,通过实验对各类算法进行了性能比较,验证了算法的有效性,讨论了新隶属度函数的适用性。(4)针对传统模糊支持向量机对非平衡情感数据集存在的分类敏感和对支持向量赋予隶属度值不够精确等问题,引入了不平衡调节因子对模糊支持向量机算法的适用性进行了改进以弥补不同类别样本的分布状态及样本点所受近邻样本密度的影响,并应用于非平衡性语音情感识别。实验结果表明,相比较于传统模糊支持向量机,该算法对样本不平衡率为3.89的TYUT2.0情感语音库分类性能上提升了4.95%,对不平衡率为13.28的CASIA汉语情感语料库分类性能上提升了10.57%,样本的不平衡率越大,分类效果越明显。