论文部分内容阅读
目前,孤独症谱系障碍(Austism Spectrum Disorder,ASD)的识别与诊断仍限于依据单纯症状学层面的观察与临床医生的经验判断。我国具有诊断ASD资质的医生的数量难以满足逐年增长的ASD患病率的临床需求,亟需研究机器智能分析的方法来辅助ASD的临床诊断。机器学习的方法是实现智能诊断的一种重要途径。针对当前机器学习用于ASD智能识别存在的一些问题,例如小样本数据上能取得很高的分类正确率而用于大样本或跨机构数据分类正确率会显著下降,本文以国际公开的自闭症脑影像数据共享项目(Autism Brain Imaging Data Exchange,ABIDE)数据集为研究对象,展开ASD患者脑异常特征提取关键技术研究,优化模式识别模型,提高大样本数据的分类正确率,提高分类模型的鲁棒性,实现跨机构数据样本识别的稳定性,为临床诊断提供重要的参考依据。本文主要研究工作如下:(1)完成了 ABIDE I(ABIDE数据集的第I部分)中的所有被试静息态功能核磁共振(functional Magnetic Resonance Imaging,fMRI)数据预处理这一繁琐而又非常耗时的工作。为构建脑功能连接(Functional Connectivity,FC)网络提供了高质量的输入数据。(2)提出了一种基于 SVM-RFECV(Support Vector Machine-Recursive Feat-ure Elimination with a stratified-N-fold Cross Validation)的 ASD 分类识别算法。首先,应用先验知识构建了 35个特定的感兴趣区域(Regions of Interest,ROI)之间的FC,并将之作为原始输入特征。在对比分析LASSO(Least Absolute Shrinkage and Selection Operator)、Elastic-net 以及 SVM-RFE(Support Vector Machine-Recursive Feature Elimination)等特征选择算法的基础上,提出基于SVM-RFECV的特征选择算法:在每剔除一个权重最小的特征而形成的新的特征子集上进行多折交叉验证,搜索能使分类正确率最高的特征子集。通过多次内嵌循环,选择稳定性较好的特征。实验结果表明,所提出的算法既可以在大样本数据集上,又能够在跨机构数据集上取得优于相近研究的分类正确率,具有较好的鲁棒性。(3)提出了一种基于改进型卷积神经网络(Convolutional Neural Network,CNN)的ASD分类识别算法。首先,运用AAL脑分区模板构建116 ×116全脑FC网络,得到1×6670的原始FC特征向量。然后,针对经典CNN,将二维输入改成一维输入,相应的卷积核和池化过滤器也改为一维;用PReLU代替经典CNN常用激活函数(sigmoid或tanh或ReLU),解决了反向求导容易出现梯度消失或神经元死亡的问题;考虑到算法是基于TensorFlow平台的,在预训练时分类器采用softmax,预训练结束后采用参数可调的SVM代替softmax作为分类器;为避免过拟合,采用了 dropout技术和L2正则化交叉熵损失函数;在综合比较了多种尺度的卷积核和不同池化方法的基础上,确定了最优的卷积核尺寸和池化方法。应用研究结果表明,改进型的CNN具有较好的特征抽取性能,在ASD大样本数据集上取得了优于相近研究的分类正确率。(4)为了进一步探讨深度学习在ASD分类识别领域的应用,提出了一种融合 SVM-RFE 和 SAE(Sparse Auto-Encoder,SAE)的 ASD 分类识别算法。首先采用SVM-RFE算法从6670维的FC特征中选择权重排名前1000位的特征,去掉意义不大的特征和一些噪声;然后对SAE反向传播时网络模型参数的更新方法进行优化,提出使用Adam优化算法自适应地调节学习率,消除摆动幅度大的方向,修正摆动幅度,使得各个维度的摆动幅度都较小,并使得网络收敛更快,在此基础上提出使用ReLU代替传统的sigmoid激活函数以进一步提高网络的收敛速度;接着使用优化后的SAE构成堆栈稀疏自编码(Stacked Sparse Auto-Encoder),通过逐层贪婪预训练从经过SVM-RFE筛选的特征中再次学习,得到更高级的特征表达;最后将这些更高级的特征输入softmax分类器,实现ASD分类识别。应用研究结果表明,所提算法为ASD样本量并不富裕而原始特征维度相对较高的应用情形提供了较好的解决方案,并在ABIDE I所有样本数据集上取得了优于相近研究的识别效果。