基于脑MRI和机器学习的阿尔茨海默病病程分类研究

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:pkuericz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:探讨轻度认知功能障碍(mild cognitive impairment,MCI)和阿尔茨海默病(Alzheimer’s disease,AD)脑核磁共振成像(Magnetic resonance imaging,MRI)的特征指标,并将MRI特征指标进入机器学习进行AD病程分类预测,从而选出分类预测的最佳模型,用于MCI、AD的辅助诊断。方法:1.随机选取阿尔茨海默病神经影像计划(Alzheimer’s Disease Neuroimaging Initiative,ADNI)数据库中编号为4018~5210的符合条件的研究对象543例,根据ADNI诊断标准对研究对象进行分组:认知功能正常(cognitive normal,CN)组139例,早期轻度认知功能障碍(early mild cognitive impairment,EMCI)组220例,晚期轻度认知功能障碍(late mild cognitive impairment,LMCI)组108例,AD组76例。收集研究对象的资料:姓名、性别、年龄、受教育程度、简易精神状态评价量表(Mini Mental State Examination,MMSE)和脑MRI资料。2.采用Philips 3.0T MRI扫描,调整MRI扫描参数,射频重复时间(TR)6.8ms,回波时间(TE)3.1ms,翻转角(FA)9°,视野大小(FOV):RL=204mm/AP=240mm/FH=256mm,层厚为1.2mm,层数170,体素:1mm x 1mm x 1.2mm。之后对MRI进行预处理:空间标准化、图像平滑和分割。最终获得272项MRI特征指标,49项皮层下体积(subcortical volumes,SV)、69项皮层体积(cortical volumes,CV)、70项表面积(surface areas,SA)、68项皮层厚度(cortical thicknesses,TA)和16项海马亚区体积(hippocampal subfields,HS)。3.272项MRI原始指标进行特征选择,具体方法是将所有指标首先进行正态性和方差齐性检验,对于满足条件的MRI指标进行单因素方差分析及LSD-t多重比较,不符合条件的指标则进行非参数检验及多个样本两两比较的Nememyi法检验,最终获得CN、EMCI、LMCI、AD组间两两比较均有显著性差异的MRI特征指标28项。然后将28项MRI指标与MMSE进行多元线性回归分析,自变量选择方法选用逐步回归法,α_入0.05及α_出0.10作为检验水准参数,获得5项指标。4.272项原始MRI指标、28项指标、5项指标、SV、CV、SA、TA、HS进入机器学习算法对AD不同疾病进程进行分类预测。本研究引入四种机器学习算法,随机森林(random forest,RF),决策树(decision tree,DT),支持向量机(Support Vector Machine,SVM),K近邻(k-Nearest Neighbor,KNN)。将不同的MRI指标放入四种机器学习算法中对CN-EMCI-LMCI-AD进行两两分类预测,通过十折交叉验证来测试算法的准确性,比较预测准确率、灵敏度、特异度、ROC曲线下的面积(Area Under ROC Curve,AUC),综合评价预测模型,选出疾病的最佳分类模型。结果:1.CN-AD分类准确率最高,其次为EMCI-AD,CN-LMCI,LMCI-AD,EMCI-LMCI,CN-EMCI分类准确率较低。RF、SVM、KNN、DT在CN-EMCI分类的最高预测准确率分别为77.78%、65.28%、59.72%、61.11%;在CN-LMCI分类的最高预测准确率为88.00%、75.60%、71.60%、70.80%;在CN-AD分类的最高预测准确率为96.45%、90.90%、89.55%、88.18%;在EMCI-LMCI分类的最高预测准确率为81.82%、71.21%、67.58%、64.58%;在EMCI-AD分类的最高预测准确率为90.00%、86.67%、84.33%、81.67%;在LMCI-AD分类的最高预测准确率为84.21%、72.78%、65.56%、68.89%。2.RF分类器分类效果最好,优于SVM、KNN、DT的分类结果。从CN-EMCI-LMCI-AD两两分类结果看出,RF分类准确率最高,其次为SVM。RF与SVM的AUC值比较,在CN-AD分类中,RF的AUC值为0.98,SVM为0.95;在LMCI-AD分类中,RF的AUC值为0.91,SVM为0.57;在CN-LMCI分类中,RF的AUC值为0.84,SVM为0.73;在EMCI-AD分类中,RF的AUC值为0.88,SVM为0.72;在EMCI-LMCI中,RF的AUC值为0.74,SVM为0.60。在CN-EMCI分类中,RF的AUC值为0.57,SVM为0.52。可见,RF作为分类器分类效果最好。3.28项MRI指标作为分类特征,分类效果最好。272项MRI指标、28项指标、5项指标、SV、CV、SA、TA、HS进入四种机器学习算法对CN-EMCI、CN-LMCI、CN-AD、EMCI-LMCI、EMCI-AD、LMCI-AD进行两两分类。CN-EMCI中,除了5项指标在DT的预测准确率最高,其余三种分类器的最高预测准确率均发生在28项指标。CN-LMCI中,5项指标在SVM、DT的预测准确率最高,28项指标在RF、KNN的预测准确率最高。CN-AD、EMCI-AD中四种分类器的最高预测准确率均发生在28项指标。EMCI-LMCI中,SA在SVM的预测准确率最高,5项指标在KNN的预测准确率最高。28项指标在RF、DT的预测准确率最高。LMCI-AD中,28项指标在SVM、RF准确率最高,5项指标在DT准确率最高,KNN的5项和28项指标预测结果一样。由于RF的预测准确率最高,并且RF在所有分类中基于28项指标的预测结果最好。因此,28项指标作为分类特征分类效果最好。结论:1.RF分类器对AD的不同疾病进程预测效果最好。2.28项MRI指标作为分类特征预测效果最好。3.RF分类器对CN-EMCI-LMCI-AD的两两分类预测结果都优于其他分类器,其中CN-AD的预测结果最好。RF分类器有效地提高了MCI/AD的自动诊断效率,可对AD早期不同阶段进行分类预测,用于辅助诊断AD。
其他文献
改革开放来,我国经济迅速发展,各地区居民收入水平都有了大幅度的提高,然而伴随着小康社会的到来,城乡间居民收入差距不断扩大,城乡收入差距问题也成为了社会各界,政府和学术
<正>~~
会议
杜甫是我国古代最伟大的现实主义诗人。对于杜诗的研究是文学史上历来的重要课题,尤其是在宋代出现了杜诗研究的高潮,当时已有“千家注杜”之称。《杜工部草堂诗笺》便是在这
为实现铁路三维信息模型在不同平台之间的互操作和信息共享,提出了一种基于多元信息分离和独立存储、支持简化层次细节和场景构建的模型数据交换方法 RIMTrans.首先,从RIM各
《金梅瓶》是第一部文人独立创作的长篇小说,它以世情社会的芸芸众生为描写对象,作者不厌其烦的把普通市井百姓的生活事无巨细的一一罗列。小说涉及到众多人物,纷繁复杂的各
综合判调法是地形图数据更新应用较多的一种方法,它以准确、快速更新来保障国民经济发展对测绘产品的需求。科学的检查方法是控制测绘产品质量的有效手段,关键在于合理使用DOM
桥梁减震装置在过去三十年里得到迅速发展,本文综合分析当前现有减震装置特点与不足,提出一种新型拉索减震支座,其结合限位拉索和盆式支座的抗震优点,可靠性和减震性能得到增
慵讷居士的《咫闻录》是成书于清嘉庆末年的文言笔记小说集,是一部在风格和主旨上追步《阅微草堂笔记》创作模式的小说,但也有自己的独创性。本文从多个角度对其进行审视、定
从2000年前中外合资,到干禧年的第一个十年外资品牌大举并购本土品牌,再到近几年创业热潮汹涌,风险投资加速新日化企业成长,以及最近拉芳家化成为近13年A股首家上市日化企业,
会议
汉代郊庙歌辞是汉朝统治者祭祀天神地祗和歌颂祖宗功德的郊庙祭祀乐章,其中保存下来的、最具代表性的作品有《安世房中歌》十七章和《郊祀歌》十九章。本文从文本解读、作者