论文部分内容阅读
由于科技飞速的发展和经济的增长,国民的生活水平得到了明显改善,但是随之也带来了一些问题,如,环境的严重污染,癌症率的持续升高等等。占女性癌症第一的乳腺癌,对女性朋友的健康产生了严重影响。“早发现早治疗”是目前降低病人死亡率的重要手段。目前,主要采取的治疗方法是,先通过X光片,核磁共振,CT等医学设备获得影像图片,然后通过医生用肉眼进行观察识别,诊断病症。但是由于医生的技术水平,疲劳等等因素,往往造成了较高的漏诊和误诊率。近年来,随着计算机技术及图形图像处理的发展,医院逐渐进行了信息化普及,医学图像可以进行统一的存取和管理,但随之也产生了一个问题,面对如此海量的数据,如何发现隐藏的有用信息,以帮助医生诊断,提高诊断的准确性和工作效率。鉴于此,我们考虑将数据挖掘技术应用到医学中,产生了医学图像数据挖掘。国内外在医学图像数据挖掘的研究上已取得了很多成果,但由于其复杂的特点,例如医学图像的高分辨率,异构等特点,尚未得到了一个令人满意的解决方案。所以,针对医学影像的数据挖掘仍具有非常大的现实意义和宽泛的前景。本文从数据挖掘的角度出发,着重研究了决策树、基因表达式编程等算法,并结合了双方的优点,提出了改进的基于GEP的集成决策树融合算法(GEP-DT算法)。并将GEP-DT算法应用于乳腺X线图像的分类诊断中,构建了一个基于GEP-DT的乳腺X线图像分类器,以提高病症诊断率,减少漏诊和误诊率。本文的主要研究工作如下:(1)分析了乳腺癌在我国现阶段的状况,提出了构建计算机辅助诊断系统的重要性,并介绍了乳腺癌病变的相关知识,包括乳腺癌病变表现的征象及相关的影像技术检查手段,介绍了目前国内外针对乳腺X线图像在图像处理和挖掘算法两方面的研究现状。(2)系统阐述了决策树和基因表达式编程的相关理论知识,分析了决策树和基因表达式编程的各自的优缺点,根据集成思想,结合两者的优点,本文提出了基于GEP的集成决策树融合算法(GEP-DT算法)。并尝试了与几种算法进行实验对比,证明了GEP-DT算法具备了杰出的性能。(3)将本文提出的GEP-DT算法应用在乳腺X线图像病症分类诊断中,构建了一个基于GEP-DT的乳腺X线图像分类器。并着重针对乳腺X线图像的特点,分析了相关的图像处理技术,如图像的灰度归一化,去噪,增强等预处理,图像分割,特征提取等等,得到了适用于乳腺X线图像的图像处理算法。最后通过在MIAS数据集上的实验仿真,对比了分类器的准确率,灵敏性,特异性以及ROC曲线分析,证明了本文提出的GEP-DT分类器具有良好的性能。