论文部分内容阅读
医学图像的数据挖掘旨在从海量的图像数据中挖掘出有效的模型、关联、规则、变化,以加速医生决策诊断的过程和提高其决策诊断的准确度。本文是在参与实施国家自然科学基金项目“基于医学图像的数据挖掘技术研究”的过程中,针对医学图像数据挖掘所涉及的一些关键技术和主要算法进行了深入的研究。提出了适合乳腺图像的预处理、特征的提取和选择以及分类算法,研究成果可应用于计算机辅助诊断系统中。主要工作和创新点在以下几个方面: 1.本文将数据挖掘技术与数字图像处理技术有机结合,研究了图像数据的变换、特征提取、约简和模式分类,提出了适用于医学影像数据挖掘的技术路线和理论框架。 2.建立了一套比较完整的可以表征乳腺图像各方面特性的特征矢量。在这些特征上进行数量型数据的离散化,并利用模糊聚类算法来进行特征优选,为肿瘤良/恶性计算机辅助分析提供了前提和基础。 3.研究了决策树分类算法,引入了“属性重要度”的概念,对决策树算法进行改进。提出了用决策树算法进行乳腺X线照片分类的方法,对乳腺癌典型病例数据进行分类,得到了较高的分类准确率。 4.研究了关联规则算法,以及关联规则分类的方法。针对关联规则中计算规模较大的问题,采用扩展项的属性,添加项约束标记的思想,对Apriori算法进行改进。提出了用关联规则算法进行乳腺X线照片分类的方法。 5.将基于Rough集的方法用于图像特征降维,采用区分矩阵和区分函数实现属性约简。将基于Rough集的方法和关联规则分类技术相结合用于关联规则提取,提出了基于粒的二进制计算提取关联规则用于乳腺X线照片分类的方法,提高了处理的效率。