论文部分内容阅读
胃肠道间质瘤(Gastrointestinal stromal tumors,GISTs)是胃肠道中最常见的间质瘤,主要发现于老年患者中,全世界每百万人口的发病率在11到19.6之间。研究发现大多数胃肠道间质瘤由原癌基因KIT或者PDGFRA的致癌突变驱动,而甲磺酸伊马替尼可以通过抑制原癌基因来进行靶向治疗。为了确定患者的基因型需要使用侵入性手术提取和分析肿瘤,不仅难度较高,也有一定的风险。为了能够无创地预测胃肠道间质瘤患者的基因变异情况,本文提出了基于放射组学和卷积神经网络的胃肠道间质瘤基因突变预测算法。该算法通过放射组学(Radiomics)和卷积神经网络(Convolutional Neural Network,CNN)分别提取胃肠道间质瘤CT(Computed tomography,X射线计算机断层扫描)图像的全局和局部特征,然后将这两部分特征拼接成为联合特征,进行特征选择后使用逻辑回归模型对PDGFRA__EXON18基因的变异情况进行分类。本文主要完成了以下研究工作:1)以十种图像类型和六种特征体系,使用PyRadiomics从CT图像中提取1803个放射组学特征。2)用ImageNet数据集对VGG-16卷积神经网络进行预训练,通过迁移学习的方法,用此网络从CT图像中提取出了 1083个卷积神经网络特征。3)以曼-惠特尼U检验去除对于分类正负情况没有显著差异的特征,再以LASSO回归来选择特征。4)构建逻辑回归模型,分别根据放射组学特征、卷积神经网络特征和联合特征实现对PDGFRA_EXON18基因变异情况的预测。实验结果表明,在三种特征中,联合特征训练的分类模型具有最佳的效果,达到了 0.797 的准确度、0.888 的 AUC(Area under ROC curve)值、0.730 的敏感度和0.817的特异度。本文提出的算法在敏感度方面效果欠佳,但综合指标AUC达到了较高水平,在预测胃肠道间质瘤患者PDGFRA_EXON18基因变异上具有潜在的应用价值。此外,基于本文提出的算法可以实现无创地检测基因突变,避免术后感染等问题来辅助医生诊断和治疗。