论文部分内容阅读
情感识别是情感计算领域中最为基础和关键的环节,是人工智能、人机交互等领域的重点研究内容。生理信号尤其是脑电(Electroencephalogram,EEG)信号因其能直接反映中枢神经系统的活动,具有客观、真实、难以伪装的特性,已经成为情感识别中的主要数据源。然而,脑电信号因个体的性别、年龄、种族和健康状况等不同而存在个体差异性,进而导致相同情感状态不同个体的脑电信号在数据分布上存在差异。传统的情感识别建模方法通常假设不同个体具有相同的特征空间及其分布,并将个体设为独立同分布样本来构建情感识别模型,而忽略了不同个体脑电信号在数据分布上的差异,导致模型的泛化性能较差。另一方面,虽然为每一个个体构建用户依赖的情感识别模型可以有效缓解个体差异性带来的影响,但是在构建模型时需要个体提供大量的训练数据,因而面临数据采集难度大、耗时长、成本高等问题。针对单一个体构建用户依赖模型所存在的问题,本文提出了一种面向脑电情感识别的相似性个体迁移建模方法。该方法通过迁移与目标个体数据分布差异较小的相似个体数据,来辅助构建针对目标个体的情感识别模型,在考虑个体差异性对脑电信号影响的同时,有效缓解了用户依赖模型所面临的大批量训练数据采集的难题。本文的主要工作及贡献包括以下三个方面:1)针对目标个体训练数据不足以及脑电信号个体差异性对情感识别模型带来的影响,本文分析不同个体脑电数据的分布特点,使用最大均值差异(maximum mean discrepancy,MMD)来评估不同个体脑电数据分布的相似性,进而选择具有相似分布的个体,并将其数据作为辅助性训练数据,来为目标个体构建的情感识别模型,缓解了对于目标个体训练数据的需求。2)为了有效利用相似个体所提供的辅助性脑电数据,本文利用基于实例迁移学习框架的TrAdaBoost方法,通过增加目标个体/降低相似个体中错分类样本的权重来有效迁移相似个体提供的辅助性训练数据。在目标个体只需提供少量数据时,为其构建有效的基于MMD相似性个体的情感识别迁移模型。3)通过在DEAP(A Database for Emotion Analysis using Physiological Signals)数据集上对该方法与传统情感识别模型、用户依赖模型进行性能对比分析,在效价维(Valence)和唤醒度(Arousal)上验证了该方法在具有少量目标个体训练数据时优于传统情感识别模型,并且在具有相同目标个体训练数据时超过了用户依赖模型的分类效果。同时,通过与核均值匹配(kernel mean matching,KMM)方法进行对比,证明了基于MMD相似性个体的情感识别迁移模型在相似被试选取和训练数据权重更新方面的优势。最后,通过对该方法进行了深入的探索,研究分析了相似个体数量对最终分类结果的影响,实验证明了少量相似被试对构建情感分类模型的有效作用,而过多的个体引入则会导致模型产生“负迁移”现象,进而影响模型的可靠性。综上所述,本文提出的面向脑电情感识别的相似性个体迁移建模方法,可以在个体训练数据不足的情况下,为其构建可靠的情感识别模型,有效的缓解了脑电信号个体差异性对情感识别建模的影响,为情感识别建模提供了一种新的思路。