论文部分内容阅读
随着科学技术的飞速进步,以及数字医疗设备的不断普及,全球每天都会产生大量的医疗数据。有效的对这些数据进行分析和挖掘可以有助于一些疾病的预防和检测,同时也可以帮助医生进行治疗。在脑部疾病的研究中,根据历史数据对脑CT图像进行分类可以对一些病变做早期的防治工作,提高治愈率的同时也可以辅助医生进行脑部疾病的诊断。在脑CT图像的产生过程中,由于机器性能或扫描技术等原因,会使产生的图像质量存在较大的差异。所以,对图像的预处理操作成为数据分析前不可或缺的一个阶段。并且,随着数据量的不断增大,人工参与的预处理操作,已经不能满足需要。而如脑部扫描图像这样的具有对称结构的医学图像来讲,其对称轴的确定在的预处理中尤为重要。因此,针对大规模的脑CT图像的预处理,首要任务就是提取脑中线。根据提取的脑中线,就可以对原始图像的偏移进行校准,提高分类的准确率。分类是数据挖掘与机器学习领域中一个重要组成部分,它在气象分析、金融分析及医疗数据分析等领域中都有广泛的应用。在脑CT图像的分类方法研究中,主要包括统计学习方法、神经网络、模式识别与机器学习方法等。现有的方法再基于充足的训练样本的条件上,在某些特定的领域都可以取得很好的分类效果。而在实际应用中常常会遇到样本分布不均、边界重叠等问题,现有的方法在缺乏充分的训练下很难获得理想的分类准确度。可视分析作为数据分析的重要途径,在医疗数据分析中已经广泛的应用于计算机辅助诊断、医疗信息管理等方面。然而,目前比较完善的基于大规模数据分析的可视化系统主要是对原始数据和结果的可视化,缺乏一定的交互,对于用户来讲仍然是一个“黑盒”。在系统中增加用户的参与程度,可以有助于提高用户对于数据分析算法的理解,从而有利于在复杂数据中发现和挖掘新的知识,同时对于普通用户来讲,也可以更加直观的观察到整个临床诊断的过程。因此,根据上述问题,本文的主要工作内容如下:(1)在本文中,提出了一种基于SIFT特征点的面向大规模脑CT图像预处理的脑中线提取方法。不同于现有的提取算法,它并不依赖于脑CT图像本身对称性,适用于对大量医学图像数据的快速分析。该方法有两个部分组成:离线部分和在线部分。在离线部分,我们给出了特征区与非特征区、特征区点集与非特征区点集以及相关点集与易混淆点集的定义。首先,通过脑中线标注辅助工具取得特征区点集,然后对特征区点集进行易混淆点过滤和相似特征点融合,得到优化后的特征点集;在线部分,使用所产生的特征点集合与输入的脑CT图像进行SIFT特征点的双向匹配,生成匹配点集并对其进行优化剪枝,最后根据优化后的特征点集拟合脑中线。(2)提出一种纹理块检索树模型BC-Tree,将纹理图像中的纹理点坐标转化为等长二进制编码,并提出基于编码的纹理图像描述方法,用于对脑CT图像进行相似性匹配。并且,针对编码树模型设计了一个多层索引结构用于对大数据集的检索。从而结合k NN分类思想,使用BC-Tree对其分类效率进行优化,得到一个面向大规模脑部医学图像的分类方法。(3)设计了一种针对具有对称性质的二维医学图像的多阶段分类可视化系统。本系统通过简单人机交互与实时图表、图像以及动画的展示对整个分类过程进行了可视化,并且系统在可视化过程中采用了简化交互策略,随着处理图像的增加,将会简化特征提取的人机交互过程,从而减少了训练及分类时间。