基于胸部CT应用卷积神经网络识别NSCLC生物学特性的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zzdlily_8000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景非小细胞肺癌(Non-small Cell Lung Cancer,NSCLC)治疗效果不佳,整体预后较差。其原因在于NSCLC生物学特性复杂,生物学行为难以预测,治疗无法个体精准化。目前对于NSCLC生物学特性的研究主要基于病理组织或外周血进行各项检测,包括常规病理检测与基因分子检测;病理检测的有创性限制其应用的广泛性,外周血液体活检无法反映肿瘤病灶内部与病灶间异质性、无法结合解剖位置信息、假阴性率过高等固有特点,使其在某种程度上无法准确描述肿瘤的生物学特性。而基于胸部CT应用人工智能(Artifitial Intelligence,AI)卷积神经网络(Convolutional Neural Network,CNN)的方法描述肿瘤的生物学特性,则可避免以上限制,并具有简单方便、能够结合解剖位置信息描述肿瘤异质性等优点。本研究以识别肺腺癌EGFR基因突变为起始,研究CNN识别NSCLC生物学特性的效能,并探索CNN是否能够预测酪氨酸激酶抑制剂类药物(Tyrosine Kinase Inhibitor,TKI)的无进展生存时间(Progression-free Survival,PFS)。材料与方法1、回顾性收集一线使用TKI药物的IIIB&IV期肺腺癌患者,明确患者PFS,一般临床特征,初诊时转移模式(寡转移、系统转移)与耐药进展模式(寡进展,系统进展)的具体情况,探索PFS时间与耐药进展模式的相关因素。2、回顾性收集具有治疗前胸部CT图像及EGFR基因状态信息的I-IV期肺腺癌患者,随机分成训练集与验证集,通过训练集数据训练CNN模型与影像组学(Radiomics)模型,在验证集上验证两种模型识别EGFR基因突变的效能。3、使用迁移学习方法,首先利用大样本肺结节CT图像建立能够判断良恶性的基础CNN模型,再将此模型迁移至EGFR基因突变识别上(使用第二部分训练集数据对模型进行微调,并在验证集中验证),明确迁移学习是否能够进一步提高CNN模型的识别效能。4、回顾性收集一线使用TKI药物的IIIB&IV期肺腺癌患者治疗前胸部CT图像与PFS时间等信息,训练CNN模型,尝试建立具有预测PFS长短的CNN模型。结果1、共收集270例IIIB&IV期患者进行PFS分析,212例患者进行进展模式分析。中位PFS为9 mos(0.5-36 mos),68.4%的患者为系统进展。EGFR基因突变位点(p=0.031)和脑转移(p=0.022,HR=1.353)与PFS相关,18外显子与20外显子突变患者PFS短于19外显子与21外显子突变患者(1 mos,1mos vs.10 mos,8 mos,p=0.031),有脑转移患者PFS短于无脑转移患者(8 mos vs.10 mos,p=0.022)。初诊时转移模式、骨转移与进展模式相关。初诊时寡转移患者容易发生寡进展(p<0.0001,OR=11.32)。骨转移患者较少发生寡进展(p=0.008,OR=0.43)。2、共收集1010例I-IV期肺腺癌患者(510例突变型患者,500例野生型患者),根据患者一般临床特征随机分成训练集(810例)与验证集(200例),CNN与影像组学模型识别EGFR基因突变的AUC值分别是0.810和0.740,CNN识别EGFR基因突变最佳决策点的特异度为0.753,敏感度为0.813,CNN模型的识别效能优于影像组学模型(p=0.0225)。3、共收集8963例肺结节(6583例恶性结节,2380例良性结节)患者术前胸部CT图像及术后病理资料,根据患者一般临床特征随机分入训练集(7084例)与验证集(1879例),训练集资料所建立的基础CNN模型判断结节良恶性的AUC值为0.941,最佳决策点特异度为0.865,敏感度为0.849。在使用第二部分训练集图像对基础CNN模型进行微调后,其识别EGFR基因突变的AUC值为0.863,最佳决策点的特异度为0.897,敏感度为0.763。高于第二部分所建立的CNN模型的AUC值(0.810,p=0.013)。4、共收集348例IIIB&IV期一线使用TKI药物的肺腺癌患者。全部患者一线使用TKI药物中位PFS为9个月(0.5-46 mos),PFS小于等于9个月的患者为短PFS(200例),大于9个月者为长PFS(148例)。根据患者一般临床特征及PFS长短随机分成训练集(278例)与验证集(70例),通过训练集建立的CNN模型在验证集上预测PFS长短的AUC值为0.647,最佳决策点特异度为0.641,敏感度为0.615。结论:1、使用TKI药物的肺腺癌患者PFS时间主要与EGFR基因突变位点及是否脑转移相关,患者耐药进展模式与初诊时转移模式及转移部位相关;2、所建立的CNN模型能够高效能地识别EGFR基因突变,识别效能优于影像组学模型;3、所建立的基础CNN模型能够高效能地判断肺实性结节良恶性,迁移学习之后能够更好地识别肺腺癌患者的EGFR基因突变;4、所建立的CNN模型能够初步预测使用TKI药物的肺腺癌患者PFS长短,但效果不佳。
其他文献
<正>性骚扰是指不受欢迎的性与利益交换的要求,或是以性为目的的羞辱和欺凌,包括不受欢迎的身体接触、语言或非语言行为[1]。研究表明,性骚扰的发生率在各种危害侵袭校园环境
教师招聘,是教师任用制度的一大进步,以才取人,公平,公正,公道,确实有助于教师素质的增强和教育质量的提高。
从理论、实践等方面论述了全面实施环境保护“三同时”保证金制度的必要性与可行性.
近年来,随着我国经济快速发展,能源的供需矛盾急剧加深,同时伴随的环境污染等问题越来越严重。如何提高能源的利用率、改善生活环境质量已成为当今研究热点。本文基于相变材料与建筑材料相结合制备建筑复合相变材料,利用相变材料的储存以及释放热能,对建筑空间环境进行能量的自动调节,进而提高工作、生活舒适性。本文以液体石蜡以及48#固体石蜡为相变原材料,经熔融共混制备出低共熔混合物。利用步冷曲线法测定其不同固、液
语言中的词汇不断地变化着,社会生活中的一切发展都在词汇里得到反映。在现代维吾尔语中,随着社会生活的发展而产生的新词主要是借助构词附加成分构成的。现代维吾尔语构词附
文章以费马原理为基础,推导了一维渐变折射率介质中光线方程满足的微分方程;讨论了光线弯曲情况与介质折射率变化之间的关系;给出了与几种曲线型光线对应的介质折射率分布.这些分
近十几年来,功率超声技术取得了巨大的进展,作为功率超声技术的核心,夹心式纵向压电换能器得到了广泛的应用。因此,如果夹心式纵向压电换能器的性能、效率和稳定性能得到提升
目的总结肝硬化合并上消化道出血的诱因及护理经验,指导临床工作。方法回顾分析我病区对52例肝硬化合并上消化道出血患者的临床资料,运用整体化护理及人文关怀,探讨肝硬化合
本文以武汉主城空间形象规划为例,针对城市空间的整体形象以及视线与景观通廊的分析的编制需求,利用数字技术与三维信息平台技术,建立集成智能分析、效果展示的综合城市空间
目的:1.比较类风湿关节炎(rheumatoid arthritis,RA)并发骨质疏松(osteoporosis,OP)患者与不并发OP患者之间临床参数的差异;2.比较健康对照组、RA不并发OP患者与并发OP患者外周血淋巴细胞亚群的表达水平,进而探讨其临床意义;3.分析RA并发OP患者BMD与外周血淋巴细胞亚群间的相关性。方法:收集我院住院诊治的734例RA患者的基本临床资料、外周血淋巴细胞亚群