基于深度学习的膀胱癌驱动基因突变及患者术后生存预测模型的构建和应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:bob2cici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景膀胱癌(Bladder Cancer,BC)是泌尿系统常见恶性肿瘤之一,具有高发展性、高侵袭性和高死亡率等特点。随着分子生物学和遗传学研究的不断深入,越来越多的证据表明,驱动基因的突变是导致BC发展的主要因素之一,并与BC患者的预后密切相关。因此,寻找BC相关的驱动基因具有重要意义。研究表明,基因突变与BC的组织形态关系密切,通过对BC病理图像的深度解析,能够发现潜在的突变信号。近年来,人工智能(Artificial Intelligence,AI)技术飞速发展,其中,深度学习(Deep Learning,DL)作为主流的AI模型,在影像学、病理学等各方面有着广泛应用。通过对BC病理图像的深度学习训练,有利于发现BC的驱动信号,并进一步预测患者的预后,推动BC的精准医学和“基因型-临床表型”跨尺度研究。目的本研究交叉融合泌尿外科学与生物信息学研究方法和技术,通过构建深度学习模型,预测BC的驱动基因突变及患者预后。方法收集三组BC患者的临床数据和病理样本。第一组队列来自TCGA(The Cancer Genome Atlas)数据库,包括404位病人的427张冰冻组织切片(TCGA-tissue)、37位病人的37张正常组织切片(TCGA-nocancer)和386位病人的457张HE染色切片(TCGA-dia),该部分数据用于DL的训练与内部验证。第二组队列(Soo-Seq)来源于苏州大学附属第一医院2014-2017年间的19位膀胱癌术后患者的46张HE染色切片,同时收集了对应的临床资料和基因测序数据,主要用于DL的外部验证。第三组队列(Soo-NSeq)来源于苏州大学第一附属医院2011年至2020年间的136例膀胱癌术后患者的542张HE染色切片,同时收集临床数据,该部分数据不包含基因测序信息,主要用于患者预后预测的外部验证。通过计算机扫描,将TCGA每一片切片扫描成互相不重叠的224*224的像素窗口,并基于MobileNetV2体系构建DL模型。将冰冻切片中75%作为训练集(TCGA-val),25%作为测试集(TCGA-test)。利用TCGA-val对卷积神经网络(Convolutional Neural Networks,CNN)进行训练,并进一步使用 TCGA-test、TCGA-nocancer、TCGA-dia 用于内部验证。为发现BC中高驱动性基因,本文引入适应度评分(fitness score,FS)的概念。计算BC各突变基因的FS,选择驱动性排列前10位的基因进行分析。根据每个病理切片中所有小切片的平均概率即预测分数(prediction score)进行突变的预测,并根据组织病理学图像中基因的突变状态调整MobileNetV2中的参数权重。比较模型预测各驱动突变的AUC,筛选出预测精度最高的驱动突变进行预后分析。在筛选出的驱动突变中,根据预测分数高低将病人排序,前20%为高分亚组,中间60%为中分亚组,后20%为低分亚组。分别比较各驱动突变中三个亚组间的生存率,并将各驱动突变的预测分数结合形成Combined模型,并在各亚组中进行分析。其次,根据各驱动突变预测分数的百分位范围从高到低进行排序(0-15%、5%-20%、10%-25%、15%-30%、20%-35%、25%-40%、30%-45%、35%-50%、50%以下)对病例进行分组划分,将高百分数组和50%以下的分组的生存率进行比较,同样将各驱动突变的预测分数进行结合分析。使用 Python 绘制 TCGA-test、TCGA-nocancer、TCGA-dia 和 Soo-Seq 队列各亚组的 ROC 曲线,采用Kaplan-Meier 分析和log-rank 检验评估TCGA-test、TCGA-nocancer、TCGA-dia和Soo-NSeq亚组间生存率的差异。结果通过TCGA-val对DL进行训练,并计算BC各驱动基因的FS,筛选出驱动性排名前 10 位的基因:TP53、FGFR3、CDKN2A、RB1、TSC1、KRAS、ARID1A、CDKN1A、KDM6A、STAG2。TCGA-test 中,DL预测前十位驱动突变的AUC分别为:FGFR3=0.74、TP53=0.66、STAG2=0.59、CDKN2A=0.59、KRAS=0.58、RB 1=0.58、CDKN1A=0.58、KDM6A=0.57、ARID1A=0.49 和 TSC1=0.43。通过AUC值,发现DL对FGFR3、TP53和STAG2这三个基因的预测精度最高,因此选择其进行内部和外部验证。内部验证上,TCGA-nocancer 中,DL 预测突变的AUC 为 FGFR3=0.41、TP53=0.50、STAG2 无法预测。TCGA-dia 中,DL 预测突变的 AUC:FGFR3=0.69、TP53=0.57、STAG2=0.58。外部验证上,在Soo-Seq中,DL预测突变的AUC为:FGFR3=0.90、TP53=0.63、STAG2=0.67。表明DL对这三个基因具有可靠的预测精度。预后分析中,在TCGA-test和TCGA-dia的内部验证上,FGFR3、TP53、STAG2和Combined模型的生存曲线和生存率差异曲线表明,FGFR3、STAG2和Combined中,预测分数与病人预后呈正相关。TP53的预后分数与病人呈负相关。在Soo-Nseq的外部验证中,生存曲线和生存率差异曲线同样表明,FGFR3、STAG2和Combined中,预测分数与病人预后呈正相关。TP53的预后分数与病人呈负相关。其中Combined模型高分与低分患者预后差异最明显(高vs低分组:p=0.007)。结论1、大多数驱动性高的基因也具有相对较高的FS。与突变频率相比,FS是驱动基因的独立测量因子。2、FGFR3和STAG2的预测分数与患者生存呈正相关,而TP53的预测分数与患者生存呈负相关。Combined模型对患者预后预测效果最佳,预测分数与患者生存呈正相关。3、DL可作为辅助诊断工具,将驱动突变与病理图像结合对驱动突变进行量化分析,帮助临床医生辅助判断病人的驱动基因突变类型并预测患者预后,为临床医生制定下一步治疗方案提供有效帮助。
其他文献
本英译汉翻译实践报告的翻译实践材料选自英文原版教材《跨文化交际入门简介之全球社会身份》(第一到五章)(An Introduction to Intercultural Communiation Identities in a Global Community),该书由弗雷德·E·詹特(Fred E.Jandt)所著。原文第一至五章分别从跨文化交际的定义、影响跨文化交际的阻碍因素、跨文化交际环境、概
学位
近年,在全球气候变化和“双碳”目标下,光伏技术发展深受世界各国广泛重视。钙钛矿光伏电池成本低、效率高,被认为是最有希望实现低成本发电的新型光伏技术之一。目前实验室单元电池认证效率已经达到25.7%,电池模组认证效率已接近20%,稳定性测试通过IEC 61215标准。本文介绍了钙钛矿光伏电池的产业化发展,百兆瓦产线的建设情况、技术进展,最后分析了目前钙钛矿光伏电池产业化面临的挑战,并提出了未来可能的
期刊
目的:通过生物信息学分析的方法,筛选出肝癌组织与正常肝组织之间的差异表达的长链非编码RNA(long non-coding RNA,lncRNA)、微小RNA(microRNA,miRNA)和信使RNA(messenger RNA,mRNA),并分别分析它们与肝癌预后的关系以及三者之间的相关性,构建出与肝癌预后相关的竞争性内源RNA(competing endogenous RNA,ceRNA)网
学位
目的胃癌作为我国常见的消化道恶性肿瘤,手术治疗仍是主要手段。输血是胃癌围手术期重要的治疗手段之一,但输血可能造成的近期及远期结果暂不确定,且对高风险输血患者的识别有利于血液资源的提前规划以及合理利用。在本研究中,旨在比较胃癌全胃切除术围手术期输血组与未输血组患者间的住院期间短期临床结果差异,并使用简易获得的临床数据,预测胃癌全胃切除术患者围手术期输血的可能,建立预测模型,以提前对围手术期输血做出规
学位
目的 分析经阴道二维超声联合三维超声容积成像技术对宫腔粘连(IUA)及其分型的诊断价值。方法 选取2020年5月—2022年6月海口市妇幼保健院收治的128例IUA患者为研究组,另取同期该院宫腔检查正常的71例女性为对照组。所有患者行经阴道二维超声、三维超声容积成像检查,将宫腔镜检查结果作为金标准。比较两组宫腔血流参数,对比经阴道二维超声、三维超声容积成像技术诊断IUA结果,比较研究组不同IUA程
期刊
目的:由于超声波自身特性及在人体内的传播规律,在消化道超声内镜诊疗过程中需要耦合介质排除气体干扰并获得目标图像。目前临床应用最广泛的超声内镜耦合介质是脱气水,但在实际应用中仍存在诸多问题。本实验探讨一种新型的内镜用无菌超声耦合剂(安德佳生物科技有限公司,苏州,中国)在小探头超声中的应用效果。方法:本实验分为三个部分。第一部分使用三种不同浓度(0.1%、0.2%和0.3%,以卡波姆计)的耦合剂进行体
学位
目的 对胃癌患者健康相关生命质量进行测量并分析影响因素,为改善胃癌患者预后和提高患者健康相关生命质量提供依据。方法 采用便利抽样方法,选取2019年9月至2021年6月在苏州大学附属第一医院肿瘤科及胃肠外科就诊、符合纳入及排除标准的365名胃癌患者作为研究对象。通过欧洲五维度健康量表(EQ-5D-5L量表)及癌症患者健康相关生命质量量表(EORTC-QLQ-C30)进行横断面调查,采用SPSS18
学位
“一带一路”连接历史与未来,沟通中国和世界,被誉为几十年来由一个国家发起的最广泛、最全面的国际性经济合作倡议,具有重要意义。在此重要背景下,笔者选取第二届“一带一路”国际合作高峰论坛主题纪录片《共筑未来》作为此次模拟口译实践的材料。《共筑未来》纪录片主题鲜明突出、内容丰富充实、语言准确严谨,适合作为模拟口译的材料,故笔者以此作为口译材料,进行模拟汉英交替传译实践。本实践报告首先介绍了此次模拟汉英交
学位
伴随着中国文化走出去热潮,相关哲学社会科学研究也不断译介到海外。这一背景下,《马克思主义中国化与中华民族精神现代化论纲》被选为外译项目。翻译材料为该学术专著的第八章,主要论述了马克思主义中国化发展的内在需要、中华民族精神对马克思主义中国化事业的动力推进作用、中华民族精神的文化内涵及功能作用。由于源文本论及马克思主义和中华文化,文本中含有许多政治和中国特色文化词。作者在论述过程中还引用了习语及典籍,
学位
目的:检测神经元经历氧糖剥夺/复氧(oxygen glucose deprivation/reoxygenation,OGD/R)后Norad,Pum2和Mff的水平及结合变化。方法:首先,将培养的原代神经元分为8组,对照(Control)组和OGD/R后0.5小时、1小时、1.5小时、2小时、4小时、6小时和12小时组,每组3次生物重复,蛋白质印记(Western blot)技术检测原代神经元中
学位