论文部分内容阅读
目的:本研究针对食管X线图像,研究数据挖掘技术在新疆哈萨克族食管癌X线图像分型中的应用,旨在为放射科医生的诊断决策提供具有实际参考价值的辅助信息,提高新疆哈萨克族食管癌诊断的准确率和效率。方法:利用MATLAB图像处理软件,手动选取食管X射线图像的感兴趣区域,对其进行中值滤波去噪和直方图均衡化的预处理以改善图像质量;提取基于灰度直方图、灰度共生矩阵、灰度梯度共生矩阵和Tamura纹理特征;采用PCA特征选择法和AUC面积约束特征筛选法对所提取到的特征进行优化选择,剔除冗余特征量;使用KNN、RF、SVM和Logistic回归分类器,通过10折交叉验证,对正常食管和早期食管癌,溃疡型、缩窄型、蕈伞型中晚期食管癌食管X线图像进行分类研究;利用参数评估、ROC和Calibration曲线对各分类模型性能进行评价。结果:正常食管和早期食管癌分型:a)PCA特征选择:提取到8个主成分,在PCA特征集下KNN(K=1)、RF、SVM和Logistic回归分类器对正常食管分类准确率为91.43%、80.38%、89.26%和95.29%,对早期食管癌分类准确率为94.29%、84.67%、92.65%和97.14%。b)AUC面积约束特征筛选:筛选到18个AUC值大于0.75的特征量,在AUC特征集下KNN(K=3)、RF、SVM和Logistic回归分类器对正常食管分类准确率88.60%、78.57%、92.96%和86.37%,对早期食管癌分类准确率为86.50%、82.65%、94.29%和85.86%。溃疡型、缩窄型、蕈伞型食管癌分型:a)PCA特征选择:提取到7个主成分,在PCA特征集下KNN(K=1)、RF、SVM和Logistic回归分类器对溃疡型食管癌分类准确率为88.13%、87.32%、93.67%和94.56%,对缩窄型食管癌分类准确率为87.90%、88.64%、92.67%和94.30%,对蕈伞型食管癌分类准确率为86.88%、85.12%、91.54%和93.36%。b)AUC面积约束特征筛选:筛选到14个AUC值大于0.75的特征量,在AUC特征集下KNN(K=3)、RF、SVM和Logistic回归分类器对溃疡型食管癌分类准确率为83.45%、87.34%、94.45%和95.68%,对缩窄型食管癌分类准确率为84.75%、83.36%、91.33%和94.05%,对蕈伞型食管癌分类准确率为83.55%、79.42%、90.58%和91.36%。结论:正常食管和早期食管癌分型:PCA特征选择法优于AUC面积约束特征筛选法;早期食管癌分类效果优于正常食管;SVM分类器分类效果最佳。溃疡型、缩窄型、蕈伞型食管癌分型:PCA特征选择法和AUC面积约束特征筛选法均适用于中晚期食管癌;溃疡型食管癌分类效果最好;Logistic回归和SVM分类器更适合于中晚期食管癌的分型;综合早期和中晚期食管癌分型结果,PCA特征选择和SVM分类器最适用于食管癌分型。本研究结果能为放射科医生对食管癌的诊断提供有价值的参考意见,尤其是对早期食管癌的诊断,为开发面向临床的新疆哈萨克族食管癌计算机辅助诊断系统奠定了基础。