多元特征选择技术在精神疾病辅助诊断中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:caicai432111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机辅助诊断的目的,是通过影像学和医学图像处理技术,结合先进的计算机分析算法,辅助发现病理,并最终提高临床诊断的敏感性和特异性。然而,在使用机器学习算法处理医学影像数据时,却往往会面临高维小样本的棘手问题,因此有必须借助特征选择提高模型的泛化性能。鉴于特征选择的结果直接脱胎于原始特征集,研究者们完全可以基于模型(如分类器的权值)反推出原特征的贡献程度和内在因果关系。而这正好切中了计算机辅助诊断的核心需求。  为此,本文基于静息态磁共振成像数据和成熟的多元特征选择技术,着重考察了躁郁症(BD)与重度抑郁症(MDD)、以及BD与精神分裂症(SZ)这两类临床上较易误诊的情况。在借助模式分类算法实现高精度诊断预测的同时,也使用具备关键鉴别信息的显著特征充分解读了影像层面的病变机理。更进一步,本文沿多模态数据融合与跨站点数据验证两条线索分别探究了脑影像数据中可能存在的生物标记,其主要工作如下:  (1)对多种特征选择算法进行定量分析比较。由于本课题的最终目标是对精神疾病患者的脑影像进行特征选择,因此有必要事先确定不同特征选择方法的适用场景。鉴于影像数据的特征维度非常高,本项工作基于生物医学领域的公共数据集,详细研究了时间复杂度较低的多元启发式搜索算法,如前向选择、后向选择、SVM-RFE和我们提出的SVM-FoBa等方法;同时也比较了传统的单变量方法:配对T检验和Fisher分数排序。结果显示,SVM-RFE与SVM-FoBa在分类的精度、敏感性、特异性和泛化性等指标上较其他典型方法有明显优势,且SVM-FoBa在多数场景中更胜一筹,可生成更为稀疏的特征子集。据此,后续的脑影像数据分析工作便可直接采用相对更优越的特征选择方法。  (2)利用结构和功能影像数据的双模态融合,区分BD与MDD的青年早期发病患者。在本项工作中,我们基于VBM(结构)和fALFF(功能)指标,使用SVM-FoBa分别考察了BD、MDD以及健康对照组(HC)三者之间的分类状况。通过权值分析,我们反推出了在分类模型中贡献最显著的生物标记。具体而言,BD的双侧额下回区域与VBM和fALFF指标都呈现出强负相关关系,其默认网络则倾向于囊括非常规的枕叶等区域。而将这些重要的功能和结构特征融合在一起之后,分类性能又有了显著提升:对于临床上易误诊的BD与MDD,经过1,000次自举采样后预测精度可达了92.1%。此外我们也发现,功能模态数据在区分BD与MDD时表现更为突出,故而有必要对BD和MDD的功能影像数据进行更细致的专项研究。  (3)针对BD与MDD患者的功能脑影像数据完成全脑网络分析。我们先采用AAL脑图谱将rs-fMRI的全脑数据体分割为116个脑区,再借助SVM-FoBa检查BD与MDD的功能连接强度是否存在差异。结果显示,仅需38条功能连接(总共6,670条)就可将BD与MDD以88.0%的精度区分开。而在这些重要的特征中,从左侧罗兰氏岛盖到右侧缘上回(BA40)的功能连接与被试的BPI指标呈显著负相关。特别的,BA40负责调节同理心(empathy)。而与MDD患者相比,BD患者更为明显的同理心缺陷也与前人的研究完全吻合。最后,我们基于实验结果和当前所掌握的证据,总结出了一张甄别BD与MDD的神经环路图。  (4)以跨站点分析的方式研究BD与SZ的全脑功能网络。本项工作的研究对象是两个站点(分别来自中国和美国)的BD、SZ和HC样本。我们在每个站点上分别使用SVM-RFE和SVM-FoBa检索三种分类场景中的功能连接数据,抽取出分类性能最显著的特征,再将两个站点的结果加以对比。实验表明,对于BD vs.SZ这一临床上易误诊的情况,两个站点的预测精度都超过了80%,并且双方都一致选中了辅助运动区到杏仁核的功能连接。综合不同分类场景的公共特征,我们发现携带分类信息的功能连接主要分布于前额叶皮层、辅助运动区、初级运动皮层、颞叶皮层和默认网络。为了验证上述结果的泛化性,我们进一步开展了跨站点分类研究,并在1,000次自举采样后对BD vs.SZ获得了68.7%的预测精度。考虑到中美两个站点在被试人种、扫描硬件设备、采集参数乃至预处理步骤上都存在较大差异,该结果应能较好地反映出显著特征所具备的泛化性和健壮性。最后,通过梳理当前所掌握的显著特征和神经科学证据,我们还绘制出了一幅鉴别SZ与BD的神经环路图,同时也证明SZ出现了全脑范围的失连接症状,且尤以运动相关脑区为甚。
其他文献
随着大数据时代的到来,许多亟待解决的数据分析问题中都蕴含了更加丰富的结构信息,如何对海量数据进行有效的结构分析,获取新的知识并加以推理运用,已成为机器学习领域的研究热点
可编程控制器(PLC)是在继电器控制和计算机控制的基础上开发出来的,它实质是一 种工业控制用的专用计算机.其系统的实际组成与单片机基本相同.该次PLC开发,是为了 作为系统集
变结构控制以其简单性、对外部干扰和模型摄动的完全不变性等优点,得到了日益广泛的应用,.该文将变结构控制分别应用于感应电机和KKV(动能杀伤飞行器,Kinematic Killing Vehi
该文深入探讨了遗传算法(GA)、人工神经网络(ANN)及其理论基础.在细致分析了神经网络BP算法的优缺点之后,提出了先用遗传算法优化神经网络的初始权阈值,再用BP算法进行神经网
该文对虚拟人的建模,运动仿真,人的变形处理等一些问题进行了理论上的探讨,并设计了实际应用中解决方案.该文首先介绍了一种以PC为工作平台的分布式虚拟现实环境系统的软、硬
随着科技的发展,控制系统的规模变得更大,控制任务也变得更加复杂。多智能体系统的协同控制能将大规模任务拆分为多个子任务交由各个智能体分别完成.因此它在机器人野外搜索,无
目前国内外大部分中型和重型汽车均采用气制动系统,在气制动系统中占有主要地位的气制动元件的性能直接影响到整车的制动性能.而计算技术的发展,给汽车制动系统零部件检测技
该文研究了各种硬盘高性能控制的基本原理,并开发出了硬盘驱动器仿真系统.具体内容有:1.简单介绍了硬盘的基本结构、工作原理和一些基本概念.2.分析了硬盘驱动器中的重复性扰
该文主要包括两个内容:一是严格反馈形系统的多模型控制;二是一类关联系统的镇定设计.该文第二至四章首次研究严格反馈形系统的多模型控制;控制的基本目标是:使系统的输出能
人工智能和计算机视觉的发展使得智能交通系统成为研究热点。作为交通环境中的主要物体,交通标志的检测与识别和行人的检测在驾驶辅助和自动驾驶系统中显得至关重要。由于应用