基于3D卷积神经网络与集成学习的阿尔茨海默症图像诊断研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:lmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
阿尔茨海默症(AD)的神经影像学自动诊断近年来引起大量关注,但至今尚未有较好的技术手段准确地诊断识别出相关疾病,由于图像识别技术的发展与突破,阿尔茨海默症图像诊断技术面临以下几个问题:(1)传统医学图像诊断技术需要人为提取图像特征,再使用机器学习分类算法,具有较强主观性;(2)AD患者脑部影像具有三维空间的特征,传统二维图像识别算法无法较好提取到大脑中的病理特征。本文针对以上问题,本研究由图像特征选取,到数据预处理,再到分类建模进行全流程的改进,将核磁共振图像(MRI)和弥散张量成像(DTI)相结合,试图解决传统图像诊断识别率差问题,实验表明,该算法在阿尔茨海默症影像学诊断取得比较好的效果,主要贡献包括:(1)提出基于多模数据特征融合框架的深度学习模型M3DCNN。针对单一数据的表征能力不足,识别准确率不够等问题,提出融合多模态数据的卷积神经网络框架M3DCNN。包含:(a)表示宏观变化的MRI数据;(b)表示微观变化的DTI数据;(c)临床补充数据。设计不同的3D卷积结构块进行组合作为特征提取网络,通过融合各类高层特征通过全连接神经网络分类。经过五折交叉验证实验,在AD vs NC上的平均分类准确率达到97.6%,AD vs MCI上的平均分类准确率达到92.0%,MCI vs NC上的平均分类准确率达到92.9%,LMCI vs EMCI上的平均分类准确率达到93.2%。四个分类任务的平均准确率均高于现有水平。(2)提出基于集成学习的深度学习AD诊断框架。针对神经网络权重初始化的不确定性,多次训练网络可能会收敛到不同的位置,导致分类结果差异过大的问题。采用集成学习的思想,同一组数据集采用多个多模态数据特征融合网络进行训练与预测,最终投票决策每个样本的类别。提出的集成框架模型在各个分类任务上比M3DCNN模型有更好的表现,其中LMCI与EMCI平均分类准确率达到97.2%左右,其他分类任务均有1-3%个百分点的提升。(3)设计实现基于M3DCNN算法的AD识别原型系统,有利于医师进行影像学及临床诊断数据可视化和计算机辅助AD疾病算法预测。
其他文献
基于深度强化学习的推荐算法具有灵活的推荐策略并且考虑了用户未来的长期交互体验,所以受到了越来越多的研究人员的关注。虽然有很多与基于深度强化学习的推荐算法相关的研究工作,但是现有的研究工作仍然面临以下两个挑战:第一个挑战是现有的深度强化学习推荐算法在学习用户偏好时没有考虑到用户的临时偏好。在用户的历史交互记录中总会存在一些很少出现并且脱离用户一般偏好的非典型的交互。由于用户偏好的动态本质,用户的非典
国画在传承的基础上不断创新,其中工笔画和水墨画成为当今绘画的主流。在传统国画中,花卉的描写是一种重要而经典的表现形式。因此,本文主要针对国画花卉的智能创作开展了一系列研究工作。工笔画在同白描有着同样精确笔触的基础上,通过大量的色彩和精确的笔触来实现对绘画对象的模拟。水墨画更加关注水墨色彩的变化,强调图像浓淡与枯润度表达的和谐性,通过有限的色彩和自然流畅的笔触实现写意的表达。从传统的基于机器学习的方
随着智能监控领域朝全天候化、多场景化的方向发展,在可见光摄像头已有一定部署基础的前提下,红外摄像头也正在被广泛应用。基于可见光与红外图像的跨模态行人重识别受到了越来越多的关注。一方面,通过行人检测得到准确的检测边界框图像作为输入,是行人重识别在实际应用中表现良好的重要基础,然而目前大部分行人检测研究集中于可见光图像而忽略了红外图像。由于不同模态图像本身存在的差异,将可见光行人检测成果直接迁移至红外
图像语义分割是指根据图像中像素的语义信息对图像进行分类分割的方法,是计算机视觉领域的一项重要任务。基于深度学习的图像语义分割网络近年来得到快速发展,但仍存在参数量以及计算量大,模型较为复杂,以及不能很好地处理图像中的小目标物体,模型分割精度很难提升等问题。本文针对当前的语义分割网络参数量和计算量大以及小目标物体的语义分割问题展开研究,主要工作和创新点如下:1、针对网络参数量以及计算量大的问题,提出
预测性维护(Predictive Maintenance,Pd M)技术在航空航天、轨道交通、机械装备等领域应用广泛,是实现工业现代化的关键技术之一。在“中国制造2025”和“工业4.0”的战略背景下,工业设备正日趋复杂化,工作环境也日渐恶劣。Pd M技术依据设备或系统的传感器监测数据,对其剩余使用寿命(Remaining Useful Life,RUL)进行预测,从而提前采取维护措施,保障运行安
人脸识别是人工智能技术研究中的热点之一,以其突出的高并发性、非触碰性等特点,在安防、监控、移动支付等工业生产领域已有广泛的应用。自AlexNet在2012ILSVRC目标识别领域取得突破性进展,各种新颖的卷积神经网络结构不断涌现。受三维人脸数据集等因素限制,三维人脸识别技术的发展相对较晚,但是随着二维人脸识别技术的发展面临如人脸表情、姿态、遮挡以及光照变化等因素的挑战,研究者逐步转向三维人脸识别的
磁共振成像(Magnetic Resonance Imaging,MRI)技术因其非侵入性、非电离的成像方式,已经广泛地应用在物理、生物、医学等领域,尤其在病灶诊断方面的前景广阔。然而,由于磁共振独特的成像机制,磁共振扫描时间过长,容易产生运动伪影,从而影响重建质量和临床诊断。因此,减少磁共振成像时间具有重要的研究意义。目前深度学习技术与日俱进,在图像重建领域表现突出,因此基于深度学习的快速磁共振
生成对抗网络(Generative Adversarial Networks,GAN)是加拿大蒙特利尔大学的Ian Goodfellow等人在2014年提出的机器学习架构。自提出以来,便受到了深度学习领域研究人员的广泛研究,该架构在图像生成领域取得了巨大的成就。尽管图像生成模型取得了巨大的进步,但其仍然存在生成图像多样性不足、生成的高分辨率图像质量差、模型优化需要大量训练数据等问题。大量的研究人员
自动导引运输车(Automated Guided Vehicle,AGV)是一种移动轮式机器人,属于智能运输设备。AGV是目前无人工厂中的重要组成部分,可以取代人工完成搬运任务。随着制造业的发展和人工成本的提高,自动化流水线也需要相应的AGV调度系统来满足日益增长的任务需求。AGV可以实现物料的高效运输,降低生产成本,因此多AGV系统正在逐步推广。基于以上背景,提出对多AGV路径规划、任务调度和任
掌握自然语言是人类区别其他生物的独特智慧特征,古往今来人们从未停止过对其的研究,近年来GPT-2以及Bert等大规模预训练模型的横空出世,给予了自然语言生成领域内的研究空前的热度。自然语言的生成是有限制的,不同的文体抑或是在不同的语境下都有其独特的约束,于是受限文本生成也成了业内的一个必然要求。深度学习方法往往需要大量的相关数据,然而数据的整理是很繁琐的,并且小的数据量根本不足以使得神经网络拟合。