论文部分内容阅读
前列腺癌是当今世界发病率最高的癌症之一,病理Gleason分级系统是目前前列腺癌应用最广泛的分级系统,Gleason分级对患者之后治疗方案的选择及预后是最重要的参考因素之一。目前主要通过活体穿刺手术获取病理Gleason分级结果,如果能使用计算机辅助诊断的方式根据前列腺磁共振影像MRI来预测患者的Gleason分级,对患者癌灶的恶化程度进行病理高低危的分类预测,那么可以减少所需的活体穿刺手术,给患者心理及生理压力带来极大缓解,且避免感染、出血等并发症,防止对癌灶恶化的诱导。本研究基于影像组学的研究框架,在得到影像数据并勾勒感兴趣区域ROI与数据预处理之后,高通量地提取特征来将肿瘤区域信息映射到高维特征空间,之后通过统计学和降维的方式去掉其中的无关信息与冗余信息,降低了特征空间维度并增加了信息密度,有效避免了维度灾难问题并可以提高模型准确度。接着将降维后的特征投入到搭建的机器学习与深度学习模型中来对前列腺癌Gleason病理高低危分类进行预测,从而以非侵入的方式辅助医师对患者的后续治疗方案选择。本论文的主要工作有以下五个方面:1、本文首先对前列腺癌与MRI影像的相关医学知识做了简要的说明,以便理解并展开相关研究工作。总结了当今国内外使用影像组学对前列腺癌的诊断方式,并对其中存在的问题与不足进行了分析,以针对这些问题建立更合适的效果更好的模型。2、利用影像组学的方法对影像特征进行提取工作。在对影像数据进行预处理后,本文对316例前列腺癌的MRI影像以及医师勾勒的感兴趣区域进行了高通量的特征提取,以便之后建立预测模型进行定量分析。对影像进行灰度直方图离散化后,共提取了6类92个纹理特征,和13个聚焦于几何描述的形状特征。这些特征能够更有效地利用有价值的医学影像信息,从而建立效果更好的预测模型。3、对提取后的特征进行了选择与降维工作,来筛去部分无关特征与冗余特征,以避免维度灾难问题和过拟合问题。本文使用Spearman相关性分析的方法,对提取到的105维影像组学特征计算与病理高低危类别的Spearman相关系数,筛去不显著相关的29维特征。在将特征投入到人工神经网络训练之前,采取PCA降维的方式在保留99%原始特征信息的前提下,得到了21维新特征空间,增加了信息密度。4、建立了基于机器学习的分类模型。本文使用SVM算法、随机森林算法与Xgboost算法三种机器学习算法模型来实现对前列腺癌Gleason病理高低危分类预测。使用的验证模型为带有100次数据洗牌的10折交叉验证。结果表明Xgboost算法在T2WI序列上对前列腺癌Gleason病理高低危分类的表现性能最好,曲线下面积AUC为0.719,准确率ACC为0.722。DWI序列中b值=2000 s/mm~2的病理分类预测效果要略好于b值等于1000或3000的DWI序列。5、建立了基于人工神经网络与Bagging集成学习算法的分类模型。本研究搭建三层前馈神经网络作为集成学习的个体学习器,使用Bagging算法作为集成学习的结合策略,最终通过多数投票法的方式确定集成学习强学习器的分类结果。在经过100次数据洗牌的10折交叉验证后,分类预测模型在T2WI序列上的表现效果最好,AUC为0.759,ACC为0.718。并对1000次训练结果的AUC值做了箱形图统计以证明交叉验证策略的必要性。总结来说,本文搭建了基于影像组学框架的四种算法模型对前列腺癌Gleason病理高低危分类进行了预测,其中基于人工神经网络与Bagging集成学习算法的分类模型效果最好,在T2WI序列上达到了曲线下面积AUC=0.759,准确率ACC=0.718的水平,表现略高于3种b值的DWI序列。算法使用的交叉验证策略保证了结果的稳定性。