基于胃癌组织病理图像纹理特征的MSI预测和预后模型构建

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:caisilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胃癌是全球最常见的恶行肿瘤之一,由于癌症的异质性,胃癌的表型复杂多样,使得癌症的诊断和治疗十分困难,而且由于多数胃癌患者确诊时已处于癌症晚期,预后较差。因此,针对胃癌异质性的研究和个性化预后模型的构建对于胃癌患者治疗方案的制定和延长胃癌患者的预后具有重要意义。微卫星不稳定性(Microsatellite Instability,MSI)是由DNA错配修复受损导致的一种特殊癌症表型,研究表明,MSI型胃癌患者拥有独特的临床病理特征,更容易从癌症免疫疗法中获益。MSI型胃癌患者通常具有良好的总体长期预后,与同期的非MSI型患者相比,具有更高的生存率,且随着癌症的进展,MSI逐渐累积增加,因此,MSI检测对胃癌患者的早期诊断和筛查,辅助胃癌治疗的临床决策以及延长胃癌患者的预后具有重要意义。传统的MSI检测需要通过免疫组织化学分析或者聚合酶链式反应进行,需要较高的经济和时间成本,难以在临床上推广到每一个患者。而组织病理学和计算机技术的发展为癌症的诊断和预后预测提供了新视野。近年来,基于病理图像的辅助诊断模型迅速发展,组织病理图像的纹理分析广泛用于癌症的分级,分类,预测和预后模型的构建。因此,本课题研究了基于胃癌患者组织病理图像进行胃癌患者MSI状态预测和预后预测模型构建的可行性。研究的主要内容包括:(1)基于组织病理图像全切片纹理特征的MSI预测研究研究基于胃癌患者的组织病理图像全切片的ROI进行特征提取,使用Lasso回归进行特征选择,选出最佳λ对应的特征,并验证特征与标签的相关性,进而结合logistic回归构建分类模型,并使用查准率,查全率,F1分数和ROC评价模型的性能。(2)基于组织病理图像小切片纹理特征的MSI预测研究为了以较低的成本实现胃癌患者的MSI检测,研究基于容易获得的胃癌患者的组织病理图像提取定量图像特征,通过特征选择技术,筛选出与胃癌患者MSI状态最相关的特征,基于得到的特征,在切片水平训练了五种机器学习分类模型,使用硬投票的方法基于切片水平的预测结果实现个体水平的MSI状态预测,针对硬投票方法的局限性加以改进,提出一种加权投票算法用于个体水平的MSI状态预测,并分别在切片水平和个体水平上通过准确率,召回率,F1分数,ROC等指标对比分析分类模型的性能。(3)基于MSI预测的胃癌预后预测模型构建为了构建胃癌患者个性化的预后预测模型,改善传统预后模型的性能,研究基于胃癌患者的MSI预测结果,为每位胃癌患者构建MSI风险评分,基于MSI风险评分将胃癌患者分为高风险组和低风险组,使用Kaplan-Meier分析绘制胃癌患者的生存曲线,结合Log-Rank检验对比了高低风险组胃癌患者的生存概率的差异,使用多因素Cox回归探究了MSI风险评分、TNM分期和临床信息对胃癌患者预后的影响,并构建了五种基于不同预后因素的预后预测模型,使用C指数,校准曲线和决策曲线分析对比它们的预后预测性能。本研究通过提取胃癌患者组织病理图像的定量特征,通过机器学习算法,结合研究提出的加权投票算法实现了MSI状态预测,进一步,基于MSI状态预测为每位患者构建MSI风险评分,分析了MSI风险评分与胃癌患者预后的关系,并基于MSI风险评分构建预后预测模型。结果表明,研究提出的方法可以以较低的成本实现胃癌患者的MSI预测,结合MSI风险评分构建的预后预测模型与传统的预后模型相比具有更好的预后性能,能够为胃癌患者的预后判断和临床决策的制定提供更好的参考。
其他文献
蛋白质赖氨酸乙酰化(Lysine acetylation,Kace)参与细胞的各种生理活动,与DNA修复和细胞信号传导等生物学过程密切相关,是最重要的翻译后修饰(Post-Translational Modifications,PTMs)类型之一。Kace在生物体中的动态调节,是保证各种生物功能正常进行的重要条件,而异常的Kace修饰将导致各种疾病的产生,如糖尿病、癌症和神经退行性疾病。因此,Ka
随着信息技术的飞速发展与互联网的普及,网络用户更加热衷于在互联网上发表自己的观点、态度,各类网络平台上积蓄着用户大量的评论文本信息,例如购物网站的商品评论、新闻网站的新闻评论、社交网站的社交评论等。这些评论文本信息中大都蕴含着互联网用户所发表内容的情感倾向,对互联网上这些带有情感色彩的评论文本进行整理分析,这对于各个行业都有重大效益。使用自然语言处理中的文本情感分析方法可以对这些带有情感色彩的评论
随着大数据成为国家基础性战略资源,许多企业和组织希望从海量数据中取得经济利益,并为用户提供便利。对于大多数企业和组织来说,他们没有处理海量数据的能力。因此,将数据挖掘任务外包给云计算服务机构有效地解决了这些企业和组织计算和存储容量不足、资源利用不足和资金投入等问题。但随之而来新的安全隐患,核心问题是数据所有者不希望自身敏感信息被别人知道。因此,隐私安全问题是海量数据挖掘技术应用的主要瓶颈之一。频繁
在大数据时代,海量多模态数据广泛存在,怎样通过模态数据间的互补学习来挖掘数据中隐藏的巨大价值,是现阶段大数据研究关注的主要问题。本文研究领域图像标题生成和视觉问题回答便是在寻找图像与文本这两种模态数据之间的桥梁。图像标题生成任务是让机器自动生成一个有意义的句子来准确描述该图像的内容,属于计算机视觉与自然语言处理的交叉领域。现有研究多通过卷积神经网络编码图像信息,循环神经网络解码生成文本信息,在此基
精神分裂症(Schoziphrenia,SC)是一种神经退行性疾病,患者在认知、记忆、情绪、运动感知等方面均有不同程度的障碍。SC患者的大脑信号异常,在结构和功能上发生的病变可能导致了其病理生理的失调。而目前,SC的诊断仍然主要依赖于患者的行为表现评分。由于对病因的认知不足,诊断方式相对单一等问题尚未解决,研究一种有助于诊断和治疗的生物标志有着重大意义。神经影像学的发展为研究精神疾病提供了更好的手
代码作者归属是识别给定代码作者的过程。随着越来越多的恶意软件和先进的变异技术出现,恶意软件的作者正在创造大量的恶意软件变种,寻找恶意代码作者身份的方法也随之成为热点。恶意代码中残留了显示作者风格的特征,这些信息可以帮助预测特定恶意软件的作者使用的工具和技术类型,以及恶意软件传播和发展的方式。代码作者归属技术可以用来识别和分类恶意软件的作者,选择较为明显的代码风格特征和更加高效的深度学习方法,对代码
计算机技术以及互联网技术在教育领域的持续发展受到了教育工作者及相关人员越来越多的关注,在线教育平台因其对时空界限的突破、对优质资源的整合等特征,自诞生以来就受到了各方关注。尤其是在2020年新冠疫情肆虐的背景下,在线学习更加被大众所熟知和使用。但与传统的教学形式相比,维持着庞杂信息的在线教育平台往往会因为缺少合适的维护而产生海量的信息碎片,在缺乏有效指导的情况下,学生的学习往往停留在较浅的层次,从
面对爆炸式增长的电子文本,人们所关心的是如何对这些数据信息进行智能化处理,并从这些文本中获取到用户真正关心的问题。在该背景下,信息抽取的概念被提了出来。事件抽取是信息抽取领域的一个子方向,同时也是该领域的一个研究重点和难点。传统的基于模式匹配的事件抽取方法需要手工的方式构建模式,这种方法耗费大量资源。基于特征的方法在提取特征的过程中会过度的依赖自然语言处理工具,这一过程也会耗费许多人力资源,而且还
造价管理是项目管理的重中之重,成功的造价管理能够给投资者带来最大的投资效益。准确的工程量作为计算工程造价的前提,是本文研究的重点。而BIM技术具有协调性、可视化、参数化等优点,同样可以为本文的研究提供技术支持。本文主要探讨了如何建立一种契合实际造价工作的标准化计量接口。尝试将建立标准化计量接口的问题转化为建立标准化计量模型的问题。提出将实际计量工作中所需的信息与基于IFC数据标准的BIM模型相关联
随着第五代移动通信系统5G技术的快速发展,全球已经进入大数据时代,用户已经不能有效利用海量互联网数据信息,“信息过载”问题日渐严重,推荐系统的出现一定程度上缓解了信息过载问题。推荐系统有效利用用户各种行为信息为用户建模,个性化地过滤无效信息。评分预测一直都是推荐系统领域研究的核心问题,其通过用户已有历史评分预测用户未知评分。虽然基于矩阵分解的协同过滤方法简单有效,但是经常受限于新物品新用户进入系统