论文部分内容阅读
目前病理学大都是以特异形态描述为主要研究方法,对病理学诊断来说,起决定性作用的是医生的阅片经验以及临床知识,由于缺乏量化标准,主观因素对诊断结果的影响特别大,常常发生不同的病理医生对同一个切片诊断结果不一。结合计算机技术与医学病理图像学的方法与理论,进行生物细胞图像的处理和分析,该研究课题正在受到广泛的关注。使用有效的方法进行自动化或者半自动化的细胞病理图像分析,特征提取和分类识别,可以辅助病理学家,医生给出准确快速的诊断结果。为此本文利用了数据挖掘的技术去研究病理图像,寻找细胞、杂质与特征的量化关联规则。本文的研究工作主要如下:细胞病理图像特征数据库的构建。本文基于超像素分割和阈值分割的优势,在此基础上构造了基于阈值-超像素的级联分割算法,能够对细胞病理图像进行有效的分割。之后又基于细胞核和杂质的视觉区别和细胞核的主要特性,提取了光密度,形态,纹理的特征,得到了细胞病理图象特征数据库。病理图像特征的选择。本文基于卡方检验计算出离散化后的特征数据对类别的影响因子,对影响因子进行排序后选择不同维度的特征,通过PCA消除特征之间的相关性,得到特征的主成分,用t-sne方法对主成分进行非线性降低到2维,基于细胞核、杂质与降维后的特征数据分布可视化结果确定了特征选择的维度。实验发现特征选择影响因子最高的前20个特征,算法可以在效率和结果上取得相对比较好的结果。病理图像挖掘算法的研究。本文在传统的考虑因素准确率上增加了覆盖率进行参数优化,并且利用粒子群优化算法得到了参数最优解,通过网格法验证了参数选择的准确。并且基于二元粒子群算法对关联挖掘算法进行了改进,能够快速得到,低支持度,高置信度,宽度长的频繁项。运用Apriori挖掘算法和基于二元粒子群的优化算法,本文得到了细胞和杂质与特征数据的量化关联规则,规则对特征测试数据集覆盖率和准确率均较高。