论文部分内容阅读
脑机接口(brain computer interface,BCI)通过在大脑和外部设备之间建立通信通道,不仅可以使得运动障碍患者重新获得控制外部设备的能力,还可以让脑卒中患者重新恢复与人沟通交流的能力。然而,由于当前用于采集到的脑电信号有限且普遍质量较差,同时来源于不同被试者的脑电信号往往存在一定的差异性,但主流的机器学习算法常常要求数据是服从独立同分布的,因此,在脑机接口系统中,主流的机器学习在泛化性能上往往表现较差。同时脑电信号中大量的特征和较少的数据量也增加了模型过拟合的风险。除此之外,目前大多数机器学习算法需要进行人工或通过交叉验证的方式进行调参,而这些方法需要耗费大量的时间,尤其是模型的训练时间较长时间。针对上述问题,本文根据组稀疏贝叶斯逻辑回归(group sparse Bayesian logistic regression,GSBLR)和组稀疏贝叶斯线性判别分析(group sparse Bayesian linear discriminant analysis,GSBLDA)两种算法提出了基于组稀疏贝叶斯逻辑回归模型的迁移学习算法(transfer learning based on group sparse Bayesian logistic regression,TL_GSBLR)和基于组稀疏贝叶斯线性判别分析模型的集成迁移学习算法(integrated transfer learning based on group sparse Bayesian logistic regression,ITL_GSBLR),并分别将两种算法应用于公开的P300数据集和Kaggle竞赛提供的错误相关信号(error-related potential,Err P)数据集。在P300数据集的字符识别任务中,本文充分利用GSBLR无需通过交叉验证的等方式进行人工调参,而是超参数自动更新的优势,实现模型的高效训练,同时通过跨个体迁移学习的方式从多个被试者的数据中得到有利于分类的先验信息,并将先验信息应用于新的模型,使得其可较快地适应新被试者的数据。在Err P的检测中,由于数据集中不同被试者的脑电数据在类别比例上存在较大的差异,因此,鉴于GSBLDA模型可降低样本类别比例不平衡所带来的不利影响这一优势,本文采用与GSBLR类似的迁移学习方式,实现对GSBLDA模型的迁移,从而得到先验信息。鉴于数据集按被试者进行划分成训练集和测试集,也为了提高模型的鲁棒性,采用模型融合的方式,实现对Err P的检测。在P300数据集上的实验证明,迁移后的GSBLR模型在P300信号识别和字符识别两方面的识别准确率上均优于迁移前的模型。错误相关信号数据集上进行的实验证明,与迁移前的GSBLDA模型相比,迁移后的GSBLDA模型在灵敏度、特异度以及AUC等性能指标上均有一定程度的提升。根据竞赛指标,我们提出的模型可在Kaggle竞赛中名列前茅。