论文部分内容阅读
目的建立乳腺疾病的彩超影像资料诊断的数学模型,评价三个模型在乳腺疾病诊断中的性能,以应用数学模型来辅助判别乳腺疾病的良恶性,规范乳腺肿块超声诊断流程,提高临床乳腺癌的诊断准确率。方法①病例收集:收集南华大学附属第一医院及南华医院经手术活检病理证实的乳腺疾病病人680例,包括患者的基本情况、症状、体征、钼靶x线、彩色多普勒超声、病理结果等117个指标。本研究选取其中彩色多普勒超声资料数据较完整的552例作为本实验的研究对象,其中恶性352例,良性200例。②数据录入:将收集的病例数据用epidate3.1软件进行录入,然后导入SPSS17.0软件建立患者乳腺疾病的信息数据库。③建模变量指标的筛选:运用SPSS软件对收集的乳腺疾病的彩超各变量指标进行筛选,选取有意义的作为建立数学模型的指标。进行筛选的标准是计数资料进行卡方检验,计量资料进行t检验,以P<0.05为检验标准。④建立数学模型:通过上一步筛选出指标作为建模的指标,应用spss clementine12.0专业数据挖掘软件制做logistic回归模型、神经网络模型和决策树模型。该软件将建模过程分成两部分,一部分是训练集,将随机抽取的70%的病例数据用于分别建立各个模型;另一部分是测试集,将剩下的30%的数据用来测试及完善已经生成的模型的性能。⑤计算及比较各个模型的诊断准确度,灵敏度,特异度。⑥模型诊断性能评估:通过medcal软件绘制各个模型的ROC曲线,通过ROC曲线下的面积大小来比较三个模型诊断性能。结果1、建模指标筛选结果:结果显示有16个彩超变量指标差异有显著性,可作为建模的指标。这些指标分别是:病灶长径、病灶短径、EDV、PVS、RI、肿块数目、超声肿块边缘一、超声肿块边缘二、超声肿块形态、肿块包膜、微钙化、肿块内部回声一、肿块内部回声二、肿块周边及内部血流信号、血流信号分级、腋窝淋巴结肿大。2、通过分析训练集、测试集的数据流,顺利建立了logistic回归、神经网络和决策树三个数学模型3、三个模型的的灵敏度、特异度及准确度:logistic回归模型为85.71%、60.67%、76.51%,神经网络88.57%、55.74%、75.90%,决策树为94.29%、82.00%、89.76%。结果提示决策树模型在对乳腺癌诊断的灵敏度、特异度及诊断的准确性均较其他模型高。4、三个模型之间的ROC曲线比较: ROC曲线下的面积分别为:神经网络模型0.717,决策树模型0.881,logistic回归模型0.732。决策树模型ROC曲线下面积较大,提示决策树模型的诊断性能较好。结论:1.利用计算机数据挖掘技术可建立乳腺彩超资料的诊断数学模型,有助于提高乳腺彩超诊断的准确性。2.乳腺彩超影像资料的数学模型中,决策树模型相较于其他两个模型的诊断准确率及诊断性能较好。