论文部分内容阅读
随着医学影像技术的快速发展,超声心动图在心脏疾病临床诊断中起着越来越重要的作用。如何方便快捷地辅助医生从海量的医学影像数据中获得有价值的心脏疾病临床诊断信息,一直是计算机辅助诊断研究的方向和目的。本文对基于超声图像的心脏疾病计算机辅助诊断关键技术进行研究和实现,主要研究内容包括基于TTE测量值的心脏病多类别分类、瓣膜病多标签分类和TEE标准切面识别。针对不同分类任务中的实际问题,对样本标签空间进行分析,围绕AdaBoost算法,提出不同的改进方法。 在心脏病多类别分类部分,针对不平衡分类中小类样本分类准确率低的问题,提出了一种基于主动学习不平衡多分类AdaBoost改进算法。首先,采用主动学习思想,选取少量的、对分类器最有价值的样本作为训练集,降低训练集的不平衡性;然后,结合代价敏感思想对多分类AdaBoost算法进行改进,提高小类样本的错分代价,降低大类样本的错分代价。在心脏病TTE测量数据集上的实验结果表明,该方法能快速提升小类样本的分类准确率,并且保证其他类别的分类准确率不会大幅度降低,综合提升心脏疾病的诊断准确率。 在瓣膜病多标签分类部分,针对标签模糊问题和标签相关性问题,提出了多标签AdaBoost模糊分类改进算法。该算法结合模糊集理论,采用隶属函数将疾病的严重程度映射到区间[0,1]内的实数值,将超声诊断结果用模糊标签向量表示;同时利用余弦相似性分析不同类型疾病之间的复杂关系,计算标签相关性矩阵并对模糊标签向量进行补充,选取合适的阈值,将标签空间划分为标签集、标签相关集和标签无关集;以最小化Ranking Loss和Hamming Loss分别提出了AdaBoost.MR改进算法和AdaBoost.MH改进算法,提高样本相关标签的错分代价。在临床瓣膜疾病数据集上的实验结果表明,AdaBoost.MR改进算法在预测疾病的严重程度时性能提升最为明显,AdaBoost.MH改进算法在预测病人患有疾病的类型时性能提升最为明显。结合两种改进算法,对未知病例进行预测的结果最接近医生给出的超声诊断结果。 在TEE标准切面识别部分,针对样本冗余问题和疾病导致的类间样本相似问题,提出了多分类AdaBoost改进算法。该算法采用主动学习方法选择训练样本,降低样本冗余程度;引入假设间隔和代价敏感思想对多分类AdaBoost算法进行改进,提高样本相似标签的错分代价。在临床数据集上的实验结果表明,该算法的G-mean指标和各个类别的分类准确率都有显著提升。针对四腔心切面识别中的数据不平衡问题,提出了不平衡二分类AdaBoost改进算法。该算法采用主动学习方法选择训练样本,降低训练集数据不平衡度和样本冗余程度;同时结合代价敏感思想,在对弱分类器的迭代训练过程中,维持查全率和查准率的平衡。在临床数据集上的实验结果表明,该算法的G-mean值、AUC值和ROC曲线均是最优的。 在基于超声图像的心脏疾病计算机辅助诊断关键技术的应用中,本文将心脏疾病预测核心技术和TEE标准切面识别核心技术融入到智能病例库平台的构建中,将研究成果应用到临床实际应用中,实现了产学研一体化。经过临床实际应用证明,本文研究并实现的全部核心技术,能有效地辅助医生对心脏疾病进行分析和诊断,提高诊断准确率和工作效率,具有重要的临床价值和实际应用意义。