论文部分内容阅读
随着人工智能的迅速发展,情感计算作为一种新兴的研究领域被提出。通过情感计算可以让计算机识别、理解、表达、适应人的情感,从而建立一种更好的人机交互环境,更好地满足用户的需求;另一方面,利用计算机的数据挖掘技术有助于研究者们更好地理解和发现与情感有关的一些重要因素。而在众多与情感相关的研究中,情感识别作为情感计算中最基础、最重要的部分在近年来得到了迅速的发展。近年来,随着认知科学研究技术和传感器技术的不断发展,研究者可以利用脑电图仪(Electroencephalogram,EEG)将不间断的大脑活动所产生的生理信号记录下来,用以直接研究情感状态和大脑活动之间的关系。大量研究表明EEG采集的信号经过处理后能很好的反映被试者的情感状态,并据此发现和情感识别相关的特征及脑区位置。因此,本文构建了一个基于特征提取、特征选择和改进分类算法的EEG数据情感识别模型,并利用该模型进行基于EEG生理信号的情感识别以及通过实验来找到一些与情感识别相关的关键因素。主要工作有:(1)EEG生理信号进行数据预处理及特征提取。EEG原始信号去噪,然后将所得EEG信号进行分段后提取出信号的数字特征、Hjorth参数、功率谱特征,实现数据降维。与以前研究不同,根据特征提取过程中是否使用了全部EEG信号本文将提取出的特征分成了两类:局部特征,全局特征。局部特征是指先将EEG信号划分成不同频段,然后针对每个频段再提取出功率谱相关特征;全局特征是指直接从全波段EEG信号中提取出数字特征和Hjorth参数。两种不同类型的特征提取方法都将用于情感状态分类,并通过结果来比较两种方法提取出来的特征与情感的相关性。(2)设计新的分类算法和决策函数,并在此基础上提出一种新的情感识别模型。基于相关研究中支持向量机(Support vector machine,SVM)在情感识别中的大范围应用以及情感分类算法方面研究的不足,本文提出一种基于支持向量机的融合核算法。该算法通过融合核矩阵,提高了支持向量机模型的信息输入量,能够有效解决数据降维后小样本分类准确率低的问题。除此之外,针对一条信号数据分段成若干个小样本后,在模型预测时引入投票决策机制根据分段中的多数类来决定原信号数据的最终所属类别。在二者基础上提出一个完整的情感识别分析模型,具体包括:EEG数据预处理,特征提取,情感状态分类。(3)特征分析及电极位置精简。在以上模型的基础上,设计了针对单特征的情感识别实验。实验中利用不同的核函数对每一个特征进行十折交叉验证,得到每一个特征对应的情感识别准确率,比较各个核函数准确率上的差异,并以准确率最高的核函数结果作为该特征对于情感分类的相关性评价指标。实验结果表明,新的情感识别模型相较于已有研究有很大的提高。与传统支持向量机核函数相比,通过本文核融合方法所得的核函数极大地提高了分类准确率,同时减少了核函数中的参数,极大地提高了通过生理信号数据建立情感识别模型的效率和数据利用率,达到90%以上。通过基于交叉验证的特征评价方法,从结果分析中发现了基于EEG数据的情感识别的大量关键特征和电极位置;并且,这些特征与已有研究文献具有很高的一致性,说明了整个模型的正确性。此外,单特征结果统计分析显示全局特征整体上优于局部特征。最后,通过浮动向前搜索算法找到能够使得所有被试数据在使用融合核SVM时情感分类达到70%以上的最小电极位置集合,进一步简化了情感识别研究中的实验设计及特征选择过程。