论文部分内容阅读
随着脑科学和人工智能技术的发展,基于运动想象脑电信号(MI-EEG)的脑机接口(BCI)技术备受青睐,并在运动神经康复的研究中发挥着重要的作用。MI-EEG作为一种生物电信号,不仅具有时变、神经生理节律和空间分布的特点,而且存在个体差异性。在全面利用MI-EEG信号特点的同时,享有普适性和鲁棒性的识别方法是MI-BCI康复研究的重点。近来,深度学习技术得到了快速发展,在诸多领域,特别是图像识别中,取得了卓越的成绩。基于深度学习识别脑电成像图的研究对于提高和改善MI-BCI康复方法性能具有重要的研究价值和应用前景。为此,本文基于快速傅里叶变换(FFT)、小波变换(WT)等时频分析工具,结合Clough-Tocher(CT)插值法深入研究了运动想象脑电成像方法,实现MI-EEG时频空特征的精确匹配;针对MI-EEG成像图信息稠密、空间分布性强的特点,提出多种卷积神经网络(CNN)的结构设计方法;为改善MI-EEG数据量小可能带来的过拟合问题,又研究了基于生成式对抗网络(GAN)的MI-EEG图像增广方法。论文取得的主要研究成果如下:(1)基于FFT和Clough-Tocher插值的脑电成像与识别方法为了将MI-EEG的时频特征正确地定位于其空间位置,提出一种基于FFT和CT插值的脑电成像方法,记为TPCT。该方法将每个导联的MI-EEG进行FFT,计算与运动想象最相关的μ、β节律的频域信息,并将其分为三个子频带进行快速傅里叶逆变换,分别求其时域平均功率值,从而每个导联获得三个特征值;进而,根据导联分布图抽取各导联的空间位置坐标,获得导联坐标图,再基于CT插值法将每导联的三个特征值插值到64×64的图像中,形成脑电成像图。最后,对VGG卷积神经网络进行池化层、卷积核大小、全连接层及网络深度四方面的改进和优化,并将修改的VGG(记为m VGG)用于脑电成像图的特征提取与分类。基于3个公开的BCI数据集进行实验研究,结果表明:本文方法相对于其他脑电成像识别方法,在两类、四类想象任务的识别中均获得了较高的识别精度和Kappa值,在混淆矩阵和ROC曲线方面同样具有优势。这说明TPCT成像图实现了MI-EEG时频空特征的自然融合,而且m VGG具有挖掘TPCT成像图中丰富的高维特征的能力,提升了识别方法的普适性。(2)基于WT和MLMSFFCNN脑电成像与识别方法为了使MI-EEG成像图更加适应其非平稳和多尺度的特点,提出一种基于WT和CT插值的多维成像法,记为WTMI。该方法基于连续WT对每导联MI-EEG进行时频变换,将感兴趣频带(FOI)对应的时频矩阵等分为3个3×3子矩阵,对每子矩阵纵向求和可获得3个子序列,再将各子序列划分为3个窗口,计算各窗口内小波系数模长平方的均值,从而构成3×3特征矩阵;再根据其导联坐标图和CT插值算法,将各导联的3×3特征矩阵中心对准各导联坐标扩展至64×64图像中,获得多维脑电成像图。为了适应多维脑电成像图的特征稠密、空间特性强、信噪比低等特点,设计了一种多级多尺度特征融合卷积神经网络(Multi-Level Multi-Scale Feature Fusion Convolutional Neural Network,MLMSFFCNN)。基于2个公开的BCI数据集进行实验研究,结果表明:本文方法相对于其他脑电成像识别方法,取得了较高的识别精度和较小的标准差。这说明WTMI成像方法在确保空间特征精确定位的同时更多地保留了其时频特征,而且MLMSFFCNN网络能够自适应地挖掘WTMI成像图的多尺度特征,实现不同范围的局部特征的自动抽取、融合与识别,提升了识别方法的整体性能。(3)基于WGAN的脑电信号成像图增广方法针对MI-EEG信号采集成本较高,数据库规模小,难以满足CNN网络训练的要求,甚至会造成过拟合问题,提出一种基于生成式对抗网络(Wasserstein GAN)的脑电信号成像图增广方法。利用WTMI方法脑电成像,并将之输入至Wasserstein GAN,经过生成器和判别器的反复对抗训练,获得一系列符合WTMI图像统计分布的伪WTMI图像。为验证伪WTMI图像质量,采用MLMSFFCNN进行识别。基于公共BCI数据库进行实验研究,结果表明:仅利用增广的伪WTMI图像数据的识别精度虽不及于原始WTMI图像数据,可是,当伪WTMI图像和原始图像混合后,数据量的增多使得识别效果得以改善,而且该识别结果相对于常用的滑窗法仍具有一定优势,基于Kappa值的统计分析同样证明了增广方法的有效性。本文研究成果对推动深度学习方法对脑机接口技术的应用具有积极的推动作用。