论文部分内容阅读
伴随着强大的存储介质、计算能力以及移动互联网的不断发展,医疗数据的井喷式增长以及快速的电子数字化将成为未来的发展趋势。目前,存储在各种医疗系统中的数据量每天都在快速增长,通过分析这些快速增长的数据,医疗大数据可以改善医学诊断的质量,提高医疗水平,减少人们在医疗上的花费及风险。因此,医疗大数据在这些领域扮演着一种非常重要且无可替代的角色,医生、病人及医疗组织也可以从中获得不少的益处。借着科学技术飞速发展的东风,医疗卫生领域的现代化程度得到快速发展。医学影像技术,如:电子计算机X射线断层扫描技术(CT)、正电子发射计算机断层扫描技术(PET)、核磁共振成像技术(MRI)等可辅助医生对病人的病情进行诊断,其在临床诊断的过程中得到医生的大量使用,因此医院每天都能产生海量的医学图像。如何利用好这些医学图像,从这些图像的背后发掘出有价值的信息,以方便医生对病人的病情进行诊断,是当前对医学图像进行数据挖掘的热点。聚类是数据挖掘领域一个重要组成部分,同时其在模式识别、生物学、图像处理、Web信息检索等方面也有着广泛应用。如在图像检索领域中,通过图像聚类对图像进行聚类预处理可以提高图像的检索性能,此外,还可以将聚类算法应用到图像分割中。由于医学图像的复杂性,如何能更加准确的对医学图像进行聚类已成为当前医学图像研究领域的热点与难点。另外,在对医学图像进行数据挖掘之后通过可视化技术将其直观的展现出来,可以作为一种直观的方法来反映它们之间的联系,特别是随着这些年可视化技术的快速发展,其能直观准确的对数据进行表达的特点已被越来越多的人所接受。根据以上问题描述,本文所做的主要工作如下:(1)本文给出了一种运用图熵的医学图像聚类方法。首先,将每张医学图像抽象成一个顶点,图像之间的相似程度作为两点之间边上的权值,由此将这些医学图像构建成一个带权无向完全图,之后对此完全图进行稀疏化剪枝处理。其次,又提出了一种运用图熵的带权无向图聚类算法,利用此方法对稀疏化剪枝后的图进行聚类,最后得到医学图像的聚类结果。(2)在实验部分,通过使用召回率、准确率及时间等方面进行分析,并且与现有的一些图聚类算法进行了对比,验证我们所提出的医学图像聚类算法的有效性。(3)在对医学图像进行有效聚类之后,为了使聚类过程和结果能更加直观的展现在医生面前,我们根据目前已有的一些方法对医学图像聚类方法的可视化进行了实现,通过对此医学图像聚类方法的可视化可以更加清晰的描绘整个聚类过程,并将此过程展现给大家。