论文部分内容阅读
轻度认知障碍(MCI)是阿尔茨海默病(AD)痴呆前期重要的过渡阶段,针对MCI阶段开展预防和治疗对延缓痴呆发病具有重要作用。神经影像技术是AD等脑疾病早期诊断使用较为广泛的研究手段。然而,AD是隐蔽的和缓慢的,样本采集困难且样本量较少,基于机器学习的AD诊断研究使用的训练集样本大多来自同一学习领域。为了充分利用相关领域的先验知识,解决样本量不足问题,迁移学习被提出并能较好地解决此类问题。因此,本文基于磁共振影像(MRI)数据,同时结合相关领域的先验信息,提出了基于迁移学习的AD早期诊断算法,实现对MCI患者的分类研究。具体工作主要有:第一,提出了一种基于判别式迁移特征学习的AD早期诊断算法。该算法利用目标域(即MCI)和源域(即AD和正常对照组(NC))的数据,获得最具有判别性的特征子集,用于MCI的分类预测。具体而言,首先,依据目标领域与源域数据的相关性,采用基于最大均值差(MMD)的迁移成分分析方法来缩小源域与目标域之间的数据分布差异,从而获得有效的特征子集;其次,考虑到TCA算法忽略了各领域样本类别与样本特征之间的相关性,这可能使得原来相似的数据在投影之后产生较大的偏差,为此添加基于类内类间散度矩阵的判别优化项,来更好的利用样本间的判别性信息提取有效的特征子集;最后,通过获取的最具有判别性的特征子集,使用支持向量机(SVM)方法来对MCI患者进行分类预测,并在ADNI标准数据集上进行验证。实验结果表明,该方法在MCIc和MCInc患者的分类中取得了较好的分类性能,分类准确率为75.13%,AUC值为0.7857。第二,提出了一种基于集成迁移学习的AD早期诊断算法。其目的是为了充分利用样本的判别信息,以实现领域间知识的迁移,并提高训练模型的分类预测性能。基本思路如下:首先,针对传统的特征迁移TCA算法对样本结构信息与标签信息利用不足的问题,采用基于联合分布自适应(JDA)的特征迁移学习算法,来缩小领域间的边缘分布差异与条件分布差异,提取领域间的共享特征,实现领域间知识的迁移;其次,为了获得更为精确的AD分类效果,提出将GBDT、XGBoost和Adaboost作为基分类器进行集成学习,利用特征子集训练得到基分类器,通过加权投票的集成策略得到最终的分类结果,实现对AD的早期诊断。实验结果表明,该方法在ADNI标准数据集上取得了较好的分类预测效果,其分类准确性为78.12%,AUC值为0.8257。