论文部分内容阅读
医疗图像识别方法研究是基于图像的计算机辅助诊断(image-based Computer Aided Diagnosis,CAD)系统中重要的研究内容。近些年,随着计算机在医疗诊断中扮演的角色愈发重要,数字化医疗图像数量也急剧增加,逐渐超出人工可处理的合适数量的范围。在这种背景下,CAD系统被广泛研究和发展当中,旨在解决人工检测医疗图像的费时、主观、劳动密集型等弊端。其中,如何在有限的数据集上更加充分、快速、准确的识别这些医疗图像成为一项具有挑战性的工作。对于医疗图像识别方法,目前常用的识别途径主要可以归纳为两种。其一是通过人工选取有效的特征进行学习,再进行分类识别,该方法比较成熟,已广泛应用于CAD系统,但需要较多人工参与部分,且精度有待提高;另一种是通过深度神经网络直接对数据图像卷积,提取有效特征,可以有效减少人工参与部分,且正确率较高。但在此基础上如何更高精度的有针对性识别医疗图像,仍是一个值得研究的问题。为了解决以上问题,本文分别在喉癌细胞(2D)识别、肺结核抗药性(3D)识别、肺癌(3D)识别这三个医疗领域提出一系列提升精度的解决方法。具体工作可以概括成以下三个方面:(1)提出了一种高效准确的喉癌细胞识别算法。喉癌细胞识别是指在获取分割后的细胞图像之后,对图像进行分类。其中有效特征的选取对细胞识别的精度有很大影响,这对数据量不是特别大的数据集的影响尤为明显。现有的喉癌细胞识别方法主要采用人工选择提取特征的方法,少部分选择深度神经网络直接提取特征,如利用CNN将特征提取和识别两步统一,但两种方法总体精度值都不很高。针对这一问题,本文提出采用VGGNET模型提取特征与利用SVM分类的方法,主要内容包括:1)提出一种自动特征提取和基于VGGNET的喉癌细胞染色模式分类方法;2)改进VGGNET模型使其更好的对样本量不是特别大的数据集提取特征;3)利用提取出的特征训练SVM,得到比直接用VGGNET模型更有效的分类器;4)通过实验评估提出方法的性能。(2)提出了一种基于改进的深度神经网络的肺结核抗药性自动识别算法。抗药结核病(TB)是一个持续数百年来威胁人类健康的死亡存在。抗药性肺结核菌株的增加和多种抗药结核菌株的出现引起了医疗领域研究者的注意。如何快速有效地预测抗药肺结核已成为一大挑战。我们对近年来出现的抗药肺结核的主要预测方法进行了综述,总结了一个可通用的肺结核抗药性识别方法框架。具体介绍了肺结核抗药预测方法的发展和不同影像学(CT扫描和X光片)的特征选择。在此基础上,为了进一步提高精度,充分挖掘3D图像信息,在提出的方法框架的基础上,本文在该领域引入了深度学习方法,并在网络结构上增添了上下文信息和3D特征的补充。在ImageCLEF2017竞赛数据集上的测试结果表明提出方法能精确地进行肺结核抗药性识别预测。(3)面向真实CT图像的医疗图像识别方法应用。目前,CAD系统研究大多局限在乳腺和胸部肺节节性病变,在喉癌细胞诊断、肺结核抗药性CT识别、肺癌识别的CAD研究仍很少,而且较不成熟。同时,上述两部分算法均是在已标注的公开数据集上进行的测试。为了增加算法的实际应用价值,本文将第二部分的算法应用到真实原始的肺癌CT图像中,并根据最终识别目标的不同,进行了微调,最终测试结果表明,算法能在实际数据中一定程度上解决肺癌CT图像识别问题。