论文部分内容阅读
背景:前列腺癌好发于60岁以上人群,居全球男性癌症发病率第2位[1]。在欧美国家前列腺癌(prostate cancer,PCa)发病率常年位居男性恶性肿瘤第一位[2]。虽中国前列腺癌发病率远低于欧美国家,但近年来呈逐年上升趋势。前列腺增生是我国中老年男性的好发疾病,随年龄增长,发病率逐渐增加。前列腺癌多发生于前列腺外周带,良性前列腺增生主要发生于移行带,但大量临床病例发现,发生于移行带的前列腺癌并不少见,且两者有时影像检查鉴别困难。前列腺癌的危险度是影响患者治疗方式和预后的重要因素,中低危的前列腺癌恶性程度相对较低,肿瘤生长相对缓慢,病人的预后及生存时间相对较长,临床上对于中低危的前列腺癌可以采取观察等待与主动检测。对于高危前列腺癌由于恶性程度相对较高,患者预后及生存时间相对较短,临床上多采取激进的治疗方式(放疗或根治性切除术)[3]。在临床中穿刺活检是目前术前诊断前列腺癌及评估前列腺癌危险度的“金标准”,但穿刺活检作为一种有创检查,会引发各种并发症。因此临床需要一种准确的非侵入性诊断方法来诊断前列腺癌并对前列腺癌的危险度进行评估,以降低对病人的伤害,并提高患者依从性。纹理分析(texture analysis,TA)作为一种新的影像评估技术,通过分析图像中灰度值、像素值的分布规律,挖掘图像中人眼难以识别的微小结构,可用于肿瘤的分类、分级、预后判断及疗效评估[4]。机器学习是一门关于人工智能的科学,该领域的主要研究的是人工智能,可利用已知数据或以往的经验,来优化计算机程序的性能标准[5],然后自动、迅速对新数据作出判断和预测。随着近年来人工智能的兴起,越来越多的研究致力于人工智能在医学上的应用。已有大量的研究证实纹理分析结合机器学习模型在肿瘤的定性、定位、分级、疗效评估及预后方面具有重大的意义及广泛的临床运用前景。目的:研究基于多参数磁共振成像(Multi-parametric magnetic resonance imaging,mp MRI)的纹理分析联合机器学习模型在移行带前列腺良恶性病变预测和前列腺癌危险度评估的可行性研究。方法:第一部分:回顾性收集2015年1月至2019年12月在我院行MRI检查并经病理证实为前列腺癌和前列腺增生的患者各100例。收集患者影像学资料,采用Ma Zda软件分别在T2WI及ADC图像上勾画病灶所在最大层面的整个前列腺组织,提取出纹理参数建立数据集,分别建立T2WI数据集、ADC数据集及总数据集(T2WI数据集+ADC数据集),然后采用Pearson+PCA的方法分别对数据集进行特征降维,筛选出对诊断有意义的参数。建立机器学习模型:于前列腺癌组和前列腺增生组各随机抽取70%病例作为训练组,剩余30%病例作为验证组。在训练组建立五种机器学习模型,分别为决策树(Decision tree,DT)、朴素贝叶斯(Naive Bayesian,NB)、K-邻近(K-Nearest,KNN)、随机森林(Random forests,RF)、支持向量机(Support vector machine,SVM)。用测试组对模型进行验证,并评价各个模型效能。第二部分:我们将第一部分中前列腺癌组的100个病例,根据其病理格林森评分(Gleason score,GS)进一步分为中低危组(GS≤7)和高危组(GS≥8)。除去缺少GS评分的17个病例,最终符合纳入标准83个病例,其中低危(GS≤7)的30人,高危(GS≥8)53人。收集患者影像学资料,采用Ma Zda软件分别在T2WI及ADC图像上勾画病灶所在最大层面的整个前列腺组织,提取出纹理参数建立T2WI及ADC数据集,运用Ma Zda自带的降维方式进行降维,并通过B11模块进行分类,得出不同降维方式与不同分类方式组合的误判率。分类结果显示在ADC序列中采用FPM+NDA分类结果误判率最低。故将ADC序列中FPM降维所得的30个纹理参数进行T检验,筛选出有统计学意义(P<0.05)的纹理参数,将有意义的纹理参数纳入Logistic回归,得出对预测前列腺癌危险度的独立危险因素,并做ROC曲线评价参数的预测性能。结果:(1)基于T2WI数据集各模型的预测性能为:DT(AUC=0.65,准确率=76%),NB(AUC=0.83,准确率=82%),K-NN(AUC=0.74,准确率=78%),RF(AUC=0.81,准确率=83%),SVM(AUC=0.65,准确率=69%);基于ADC数据集各模型的预测性能为:DT(AUC=0.72,准确率=71%),NB(AUC=0.90,准确率=88%),K-NN(AUC=0.73,准确率=71%),RF(AUC=0.84,准确率=83%),SVM(AUC=0.67,准确率=69%);基于总数据集各模型的预测性能为:DT(AUC=0.87,准确率=84%),NB(AUC=0.93,准确率=90%),K-NN(AUC=0.84,准确率=88%),RF(AUC=0.84,准确率=83%),SVM(AUC=0.80,准确率=78%)。(2)在基于T2WI数据集、ADC数据集及总数据集建立的NB模型与其他四个模型相比均有较好的诊断性能,表现出非常好及优秀的性能(AUC=0.83-0.93)。基于ADC数据集建立的各个模型性能普遍均优于T2WI数据集建立的各个模型。在三个数据集中基于总数据集训练的NB模型与其他模型相比性能最佳(AUC=0.93,准确度=90%)。(3)在纹理分析对移行带前列腺癌危险度的研究中发现与T2WI相比,ADC序列包含更多的区别中低危及高危移行带前列腺癌的纹理特征。前列腺整体纹理特征预测移行带前列腺癌危险度的独立影响因素为Wav En HH_s-5和Wav En HL_s-5。用Wav En HH_s-5及Wav En HL_s-5参数进行前列腺癌诊断,AUC分别为0.799、0.765,表现出良好的诊断性能。两个参数的联合诊断性能更好,AUC值达0.835,表现出非常好的诊断性能。结论:基于mp MRI前列腺癌影像组学模型可以较好的诊断移行带前列腺癌,纹理分析在预测移行带前列腺癌的危险度方面具有重要的意义。前列腺癌影像组学有良好的临床运用潜能,将来有望成为放射科医生的辅助诊断工具。