基于CT影像和临床信息的肺癌生存期预测方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:joyceywq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肺癌是最常见的恶性肿瘤,其发病率和死亡率都逐年上升,并一直是影响人们正常生活和身体健康的首要危险因素之一。早期准确预测患者疾病特异性生存期对于疾病诊断、治疗计划和生存期改善极其重要。其最大意义,就是通过早期智能预测确定肺癌病人的重要预后因素,以便于合理防止过度诊断和医院资源的浪费,同时为临床医师和家人进行医学决策提供依据。近年来,随着医学设备的更新迭代以及计算机技术的快速发展,多模态、多时期的医学数据应运而生。在智慧医疗背景下,数据分析技术的不断发展和深度学习技术的不断创新,极大地促进了多模态医学数据的相互融合。已有相关研究表明,多种类型的数据之间存在相关性和互补性,有效联合多种模态的医学数据对临床具有重大意义。同时,不同阶段的医学影像数据间又包含有大量与疾病演化(出现、发展或消亡)相关的时间信息,在时间维度上探索肺部图像的演化过程,同样对指导肺癌生存率的预测起到关键作用。基于以上现状,本文提出了基于长时程CT影像和临床信息的肺癌生存期预测方法研究,主要包括以下几方面的工作:(1)基于多时期临床数据的时空混合特征提取方法研究为了使计算机能够模拟临床医师从多时期医疗数据中有效挖掘临床重要特征,我们提出了一种基于多时期临床数据的时空混合特征提取方法,参考Res Net在分类问题优异的表现,构建了一种多分支残差神经网络MR_Net来分别对三个时期的CT图像进行特征提取,将患者多期的CT图像数据作为输入,充分挖掘病变感兴趣区域图像的深度特征。同时,引入病程的时间维度特征,探索肺癌全阶段随访影像的关联演变因素,从肺部病灶演变的机理角度分析其多元特征,提出了一种长时程注意力机制LSM。利用不同疾病过程和时间点之间的潜在共享信息,探索多种特征之间的信息异质性和互补性。该机制能够对提取的多时期特征进行融合形成一个时空混合特征,实现了CT影像中同一病例跨时期病灶时空特征的提取,实验结果表明,生存期预测精度达到85.94%。同时,利用ANOVA算法对临床文本数据进行特征选择与提取,最终确定出对肺癌疾病特异性生存期影响最大的七个属性,为后期多元特征融合模型的建立和预后预测研究打下坚实基础。(2)基于多模态数据融合的生存期预测方法研究由于患者病例信息对最终病情的诊断和分析有着重要的影响和作用,我们提出了5种不同的多元特征融合模型用于整合CT图像数据的高维特征和临床文本特征,最终实现了融合特征的分类预测,验证了CT图像数据和临床文本数据对于肺癌疾病特异性生存期预测的互补性和二者融合的有效性,生存期预测准确率高达86.78%。本文还根据细胞形态学特征将原始数据集划分为腺癌、鳞癌、大细胞癌和小细胞癌进一步进行分析,充分表明了该融合模型对肺癌疾病特异性生存期预测的适用性及有效性。实验结果表明,本文提出的多时期、多模态预测模型优于目前同领域其他方法,在短期生存期、中期生存期和长期生存期的分类中实现了86.78%的准确率,模型能够准确地进行肺癌患者的预后评估,进而帮助医生为肺癌患者制定更加合适的治疗策略,帮助实现精准医疗的目标。
其他文献
微表情作为一种独特的面部表情,和一般的表情比较,通常具有如下几个特点:一、动作显现时间特别短暂,一般只有1/25s~1/3s;二、面部情绪动作强度比较低,很难被人们发觉;三、是由人类在无意识状态下产生的;四、对微表情方面的研究通常在视频资料中展开,而对普通面部宏表情的研究在单帧的图片中就可以进行。由于微表情情绪都是由人类在其自身意识没有感知的状态下自发生成的,一般很难被隐藏,能够揭示人类最为真实的
学位
随着深度卷积神经网络的发展,基于深度学习的视频目标检测算法的检测精度和速度都取得了突破性的进展,但其仍面临着诸多挑战。比如逐帧通过大型卷积神经网络提取特征并进行特征聚合,单帧图像检测算法计算资源消耗大,不能满足实时在线的视频目标检测。本文以基于内存增强的全局-局部融合方法(MEGA)为基本的检测框架,提出一种基于特征传播和知识蒸馏的视频目标检测算法,分别从时间维度和单帧图像目标检测维度对MEGA算
学位
目前,语义分割任务主要是通过卷积神经网络提取影像数据中的语义信息,实现图像的像素级分类。随着卷积神经网络的不断发展和完善,基于神经网络的分割模型在语义分割任务中取得较高的准确率,但是这些分割模型在训练过程中通常需要强大的算力支持,无法达到实时分割的效果。现有实时分割算法虽然可以快速对图像进行分割,但在图像边缘部位分割粗糙,无法达到精细分割的效果。为了使分割算法达到精确且快速分割的效果,本文提出了多
学位
猕猴作为人类的近亲,在生理上与人类接近,通过猕猴来探索人脑的工作机制和病理机制是人脑研究的一种重要手段。近年来,跨物种比较神经影像学新技术和方法的研究越来越受到重视,并逐渐成为脑科学研究的热门问题。目前,主要的跨物种比较方法是使用已有同源脑区作为参照系,该方法比较依赖已有同源脑区的信息,而在部分脑区的研究过程中,可能存在先验同源脑区信息缺失的情况。最近的研究表明,在高等灵长类动物中,白质组织在不同
学位
命名实体识别作为自然语言处理领域的一项基础性研究课题,其目标是在句子中辨认并提炼出指定类型的实体词信息。准确的辨别非结构化文本中的实体词可以协助完成诸如智能翻译、自动摘要、情感分析等多项下游任务。材料命名实体识别对机器理解材料领域文献,构建材料知识库起着重要的作用,正确且高效的识别材料实体有助于提高查阅效率并减少重复的科学研究工作。但是目前材料领域命名实体识别还存在着一些不足:(1)目前常用的词嵌
学位
股票价格预测是金融和计算机学科交叉领域的经典问题。由于股票市场内部机制极其复杂,市场波动性极强,准确预测股票价格被认为是最具挑战性的问题之一。深度学习技术在自然语言处理、图像识别等领域的成功应用为解决股票价格预测问题提供了一种新的思路和方法。长短期记忆(LSTM,Long Short-Term Memory)神经网络由于其具有链状、记忆、选择遗忘等的结构,在时间序列预测问题中表现出良好的性能,是目
学位
伴随着工业化进程的快速发展,人们对居住的环境的空气质量提出了更高的要求。气体传感器作为空气质量监测系统的关键原件,其敏感材料的特性对传感器性能有决定性的影响。近年来,新兴的金属有机框架(Metal Organic Frameworks,MOFs)材料为开发高效的气体传感器提供了崭新思路。与传统金属氧化物材料相比,MOFs材料由于具有更大的孔隙率和比表面积,尤其是可调节的孔径以及可变的功能基团,为气
学位
在数据挖掘、生物信息学和文本识别等应用中,高维数据带来了诸多挑战。如何利用特征选择技术从这些复杂的大数据中挖掘出能反映样本信息的关键特征,一直以来都是诸多领域中的关键问题。特征选择旨在筛选出包含重要信息的特征,同时剔除无关或冗余特征,最终获得一个具有最大信息量的特征子集,继而有效降低学习算法的计算成本,并提高数据的可读性和可解释性。本文针对高维数据中重要特征的筛选问题,以互信息和交互信息等信息度量
学位
天文观测手段的进步要求能够高效地从海量数据中发现稀有天文现象。耀发(Flare)现象是一种恒星磁场能量快速释放后缓慢恢复至原有幅度的现象。当前对于耀发样本的研究多根据恒星的磁场信息及其统计特征生成的时间序列数据对耀发现象进行预测或分类。在由地基广角相机阵(Ground based Wide Angle Camera,GWAC)记录到的约791万条的星等变化时间序列数据集上,耀发现象正样本仅有几十条
学位
关键词覆盖最优路径查询(Keyword-aware Optimal Route Query,KOR)查找满足关键词全覆盖和路径长度约束条件下,时间开销最小的路线,是旅行规划、路径导航等应用的高频查询。尽可能地缩短KOR的执行时间是KOR优化的最主要目标。现有算法的优化主要是采用高效的路径拓展剪枝策略,缩小搜索空间,降低算法复杂度,但是在查找长路径时,由于搜索深度大,搜索规模的增加依然过大。针对现有
学位