论文部分内容阅读
医学影像分类技术是有效组织存储海量医学影像数据,利用其中蕴含的信息支持临床诊疗的重要支撑。医学影像分类的临床应用很多,一方面,医学影像全局分类是提高医学影像归档存储和医学影像检索性能的关键;另一方面,医学影像局部分类是实现局部病灶识别和亚分类的主要方法。早期的研究使用全局特征描述医学影像,不能实现医学影像局部细节的详细描述。近年来,局部特征被越来越多地使用于描述医学影像,视觉词袋模型被广泛借鉴以实现医学影像的分类。本文聚焦于基于视觉词的医学影像分类任务,针对其中遇到的问题,进行深入研究。首先,对复合视觉词进行定义,结合多尺度分析,提出了一种基于复合视觉词的医学影像分类方法;然后,分别从医学影像的特征提取、视觉词学习和医学影像分类器学习三方面进行更深入地研究,对基于复合视觉词的医学影像分类方法不断完善,以提高医学影像分类效果。本文主要工作包括:(1)针对单一特征向量不足以有效融合不同参数下提取的多个特征向量,影响了传统视觉词袋模型分类的问题,定义了复合视觉词,并结合尺度分析,提出一种基于尺度复合视觉词的医学影像分类方法,以提高医学影像分类效果。首先,利用小波变换并结合空间上下文信息,生成多特征向量组成的特征矩阵,用以对视觉词进行描述,称为尺度复合特征;其次,根据医学影像类别标签,利用集成学习实现多特征组成的复合视觉词的学习和标注;最后,根据视觉词的标注结果,使用投票策略进行医学影像类别的决策。采用两个公开数据集进行验证:全局影像分类数据集ImageCLEFMed;局部的肺气肿病灶识别与亚分类数据集Emphysema Database.实验结果表明该方法可以达到较高的准确性。(2)针对医学影像灰度变化值域较大,影响了传统特征表达效果的问题,对医学影像特征提取进行了深入研究,提出一种基于轮廓复合视觉词的医学影像分类方法。该方法提取医学影像的纹理轮廓,即提取易被人眼观测的主要纹理,忽略不易被察觉的次要纹理。首先,通过无监督方法实现医学影像的像素级聚类,聚类边缘点集被视为拟定轮廓点集;其次,构建聚类核值相似区域,通过判别规则去除噪音,得到轮廓点集,作为轮廓视觉词集合;然后,定义轮廓特征描述符,生成轮廓复合特征,用以描述医学影像;最后,对轮廓视觉词进行集成学习,实现医学影像分类。采用ImageCLEFMed与Emphysema Database数据集进行实验,结果表明该方法有效提高了分类准确性。(3)针对视觉词学习过程中缺少对视觉词有效性判断的问题,对视觉词学习进行了深入研究,提出一种基于复合视觉词典学习的医学影像分类方法。在视觉词的学习过程中,通过多示例学习更好地利用视觉词与其多个特征之间的关系,根据视觉词的学习结果,去除普遍分布于各医学影像类别中的“停用词”。首先,对医学影像中的复合视觉词及其所包含的多特征进行多示例建模;然后,通过一组学习器实现复合视觉词典的学习,输出结果为一个学习器集合所表示的一组划分规则;最后,使用该视觉词典对待分类医学影像中的视觉词进行查询,实现医学影像分类。采用ImageCLEFMed与Emphysema Database数据集进行实验,结果表明,利用该方法可以在不同程度上提高医学影像分类效果,特别是提高了肺气肿层影像分类的敏感性和特异性。(4)针对在实际临床中,视觉词可能拥有多个标签的问题,对医学影像分类器学习进行了深入研究,并对视觉词多示例学习模型进行扩展,提出一种基于复合视觉词类别空间的医学影像分类方法。首先,利用代表各医学影像类别的坐标轴构建坐标系,进行类别空间的构建;其次,利用医学影像特征示例在各医学影像类别之间的分布关系来表示医学影像视觉词;最后,利用视觉词的矢量和来表示医学影像,并利用余弦相似度实现医学影像分类。该方法结合视觉词典学习方法可以简化类别空间构建过程,并且较容易被推广到层次分类任务中。采用ImageCLEFMed与Emphysema Database数据集进行实验,结果表明,基于类别空间的医学影像分类方法有效提高了分类性能,特别是结合视觉词典学习方法,有效提高了对全局医学影像层次分类的效果。综上,本文提出的算法有效改善了传统的基于视觉词袋的医学影像分类方法存在的问题,提高了分类的准确性,敏感性和特异性。