论文部分内容阅读
临床上,一般由医生根据喉部病变图像对喉部疾病进行诊断。在看图像寻找病变区的过程中,通常会耗费医生很多的精力。可能会导致医生疲劳,从而出现工作效率降低或者误诊的情况。采用计算机进行喉部病变的辅助诊断可以避免上述问题。目前,基于计算机的喉部病变图像辅助诊断系统,主要针对喉部病变图像进行分类,这种方法不利于医生对预测结果进行核对。本课题为了解决这个缺点,设计了一种可以给出病变区域和病变类别的辅助诊断方法。本文收集制作了病变数据集,进行实验研究。针对系统要给出病变位置和病变类别的设计要求,提出了一种基于区域的全卷积网络(Region-based Fully Convolutional Networks,R-FCN)的喉部病变图像检测方法。为了验证R-FCN模型在复杂背景下,对多器官、不完整器官以及由病变导致形状发生变化的器官的识别能力。本文收集并制作了喉部器官数据集进行实验验证。实验结果表明,R-FCN对器官测试集中会厌和声带的平均精度分别为93%和91%。同时,二者的均值平均精度(mean Average Precision,m AP)为92%。用含有7类标签的喉部病变数据集,验证待检测物体类别数量的差异对R-FCN模型训练效果的影响。实验结果表明,在图像中存在复杂背景以及多个目标的情况下,R-FCN对喉部病变测试集检测的m AP为64.55%。对比器官数据集92%的m AP说明,在每类图像数量相同的情况下,待检测物体类别数量的增多会降低模型的检测精度。此外,在R-FCN对喉部病变测试集里声带息肉这一类别的检测结果中,大部分检测框的尺寸小于其对应标注框尺寸的一半。针对R-FCN模型对声带息肉检测框的尺寸与其标注框相差较大的问题,提出了用K-means算法结合R-FCN的改进方法。通过对R-FCN生成检测框的过程以及常用的聚类方法进行分析,得出R-FCN检测框的大小与锚点框的尺寸有关。基于此,我们采用K-means聚类训练集的标注框得到9个矩形框尺寸,来代替R-FCN模型中锚点框(Anchor box)的默认尺寸。再用喉部病变数据集对新的R-FCN模型进行训练和测试。实验结果表明,改进方法得到的声带息肉类检测框的大小更匹配本文所用数据集中声带息肉类标注框的大小。对喉部病变测试集检测的m AP从64.55%提高到了69.01%。