论文部分内容阅读
乳腺癌是目前女性中最为常见的一种癌症。一般对乳腺癌患者的诊断和治疗都是通过乳腺X线图像,因为其拥有高分辨率和突出乳腺细节信息的特点可以提高诊断的正确性。但是,由于技术限制,在拍摄X线图像时,会不可避免地在图像中引入噪声,影响医生的分析和判断,更有可能导致临床上的误诊,对患者的诊治造成无法挽回的影响。因此,在对致密型乳腺癌患者进行诊断之前,对其乳腺X线图像进行预处理操作是不可或缺的一个步骤。并且,一种能够自动有效地对X线图像进行预处理的方法已成为该领域的热门研究课题。特征提取方法作为提取图像信息的重要途径,目前在人脸识别,图像检测等相关领域有着广泛的应用。小波变换是针对乳腺X线图像较为常见的特征提取方法,但其会在提取特征的过程中丢失很多有用的信息,从而导致误诊现象频频发生。分类是机器学习和数据挖掘的重要组成部分。并且,数据的质量决定了分类算法的分类效果和时间复杂度,因此数据清洗是分类操作的必要步骤。另外,单个分类模型的学习能力是有限的,因此应考虑多模型融合的分类方法提高模型的预测和泛化能力。根据上面的问题,本文主要的研究内容如下:(1)针对致密型乳腺X线图像的预处理,本文提出了一种基于数学形态学的方法。基于数学形态学的方法具有非线性滤波的特点,因此它既可以缓解由于致密的乳腺所引起的图像敏感性较低的问题,同时也可以有效去除图像拍摄过程中所引起的无效噪声。(2)针对预处理后的乳腺X线图像,本文提出了一种基于非下采样轮廓转换法(NSCT)的特征提取方法。首先通过NSCT图像分解,得到原始乳腺X线图像的一系列特征子图,然后通过泽尼克矩(Zernike矩)从特征子图中提取特征数据,即将通过NSCT获得的特征子图作为输入,并输出高阶的泽尼克矩阵,很好地保留了原始乳腺X线图像的特征信息。(3)针对NSCT特征提取后的数据,本文提出了一种组合分类器模型。首先,在特征选择阶段运用模型选择法挑选出可以更好地表达原始乳腺X线图像的特征;然后,特征降维阶段,运用主成分分析法(PCA)去除次要特征保留主要特征,在降低特征数据量的同时提高特征数据质量。最后,通过梯度下降法设计组合分类器,把准备好的特征数据送入模型学习并得到最终的分类模型。