论文部分内容阅读
阿兹海默症是一种发病隐匿的神经系统退行性疾病,多发于65岁以上的人群,发病过程缓慢且不可逆,临床上主要症状为记忆功能退化,认知能力衰退,并可能伴随其他生理和心理障碍。迄今为止仍没有有效的治疗手段可以在晚期阶段阻止该疾病的进一步恶化。但研究表明,如果在阿兹海默症早期发病阶段(轻度认知障碍)采取有效的治疗手段可以减缓疾病的发展,可以防止病情的进一步恶化。近几年,利用机器学习来进行神经类疾病的识别诊断已经成为了一个热门的研究方向。特别是多任务学习以其能同时评定疾病严重程度(分类)和预测相应的临床评分(回归)而被广泛应用于阿兹海默症的研究。基于这一思路,本文分别讨论了自适应多任务双结构特征选择算法以及子类个性化特征选择算法,可以有效的选择出与疾病发展相关的判别性特征,即生物标记物。本文的贡献概述如下:(1)提出了一种自适应多任务双结构的特征选择算法,该方法通过探索疾病数据的标签空间和回归空间的流形结构,同时学习这两个任务之间的相似度矩阵和相应的特征映射空间。通过对重构的标签空间和临床评分空间进行编码,自适应地度量疾病数据之间的相似性。实验结果表明,提出的方法在这两个任务中均获得较好的实验结果。(2)提出了子类个性化特征选择算法。在临床上,尽管患者的疾病严重程度处于相近的阶段,但不同的患者个体特征往往显示出高度的个性化。因此,如何捕捉患者的异质性,以进行个性化的预测建模已经成为一个亟待解决的问题。针对这一问题,我们提出了一种新的个性化特征选择方法。该方法可以对所有实例和特定实例子集进行建模,分别确定共享特征和个性化特征。实验结果表明,该方法在阿兹海默症数据集上取得了良好的预测性能。