基于R-FCN的喉部病变图像检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bjjgx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床上,一般由医生根据喉部病变图像对喉部疾病进行诊断。在看图像寻找病变区的过程中,通常会耗费医生很多的精力。可能会导致医生疲劳,从而出现工作效率降低或者误诊的情况。采用计算机进行喉部病变的辅助诊断可以避免上述问题。目前,基于计算机的喉部病变图像辅助诊断系统,主要针对喉部病变图像进行分类,这种方法不利于医生对预测结果进行核对。本课题为了解决这个缺点,设计了一种可以给出病变区域和病变类别的辅助诊断方法。本文收集制作了病变数据集,进行实验研究。针对系统要给出病变位置和病变类别的设计要求,提出了一种基于区域的全卷积网络(Region-based Fully Convolutional Networks,R-FCN)的喉部病变图像检测方法。为了验证R-FCN模型在复杂背景下,对多器官、不完整器官以及由病变导致形状发生变化的器官的识别能力。本文收集并制作了喉部器官数据集进行实验验证。实验结果表明,R-FCN对器官测试集中会厌和声带的平均精度分别为93%和91%。同时,二者的均值平均精度(mean Average Precision,m AP)为92%。用含有7类标签的喉部病变数据集,验证待检测物体类别数量的差异对R-FCN模型训练效果的影响。实验结果表明,在图像中存在复杂背景以及多个目标的情况下,R-FCN对喉部病变测试集检测的m AP为64.55%。对比器官数据集92%的m AP说明,在每类图像数量相同的情况下,待检测物体类别数量的增多会降低模型的检测精度。此外,在R-FCN对喉部病变测试集里声带息肉这一类别的检测结果中,大部分检测框的尺寸小于其对应标注框尺寸的一半。针对R-FCN模型对声带息肉检测框的尺寸与其标注框相差较大的问题,提出了用K-means算法结合R-FCN的改进方法。通过对R-FCN生成检测框的过程以及常用的聚类方法进行分析,得出R-FCN检测框的大小与锚点框的尺寸有关。基于此,我们采用K-means聚类训练集的标注框得到9个矩形框尺寸,来代替R-FCN模型中锚点框(Anchor box)的默认尺寸。再用喉部病变数据集对新的R-FCN模型进行训练和测试。实验结果表明,改进方法得到的声带息肉类检测框的大小更匹配本文所用数据集中声带息肉类标注框的大小。对喉部病变测试集检测的m AP从64.55%提高到了69.01%。
其他文献
基于天基平台观测的点目标受到大量恒星、杂波、虚警和噪声等干扰因素的影响,使得我们在利用高斯混合概率假设滤波(Gaussian Mixture Probability Hypothesis Density Filter
研究目的:探讨儿童在不同视觉输入(睁眼、闭眼)及不同认知任务(单一任务、双重任务)下阶梯动作下肢生物力学特征的变化规律,从而揭示不同视觉输入及认知任务下阶梯时个体对平
随着科技的发展,安防技术正向网络化、高清化、智能化等方向不断演进。作为安防产业的发展前锋,视频监控软件也在人工智能、深度学习、数据隐私保护等技术方向持续创新前行。
空间单向传输结构是指仅透射沿空间中某一方向入射的电磁波,而反射或吸收沿相反方向入射的电磁波的结构。具备背向吸波特性的空间单向传输结构在电磁隐身、雷达罩等领域有着
基质硬度对细胞的迁移、增殖、分化等多种功能和行为产生重要影响。目前,脐带间充质干细胞(Umbilical cord mesenchymal stem cells,UC-MSCs)因其强大的自我更新与多向分化的能
随着科学技术的发展,特别是现代工业电子、航空航天、图像处理等领域的崛起,滤波技术已经成为当今学术领域和工程领域最为热门的研究课题之一。根据场景需求不同,所使用的滤
现如今,智能手机已经成为日常生活和工作中必不可少的工具之一。而且网络的普及,加速了智能手机的流行程度,使用户能够随时随地使用智能手机。在用户使用手机的过程中存在着
光纤激光器由于其光束质量好、散热优良、无需准直、结构紧凑和光-光转换效率高等优点,被广泛应用到机械精密加工、国防武器、光纤传感、医疗和激光雷达等方面。作为光纤激光
碳源气催化裂解技术可制备氢气和优质碳纳米管,具有良好的应用前景。前人研究发现,CO/CH4双组分碳源气在催化裂解过程中存在显著的协同作用。相较于单组分碳源气体系,CO/CH4
当前主流的电磁屏蔽材料通常以复合型导电高分子材料为主,然而该类型材料的屏蔽效果往往受填料粒子在聚合物基体中分散状态的影响,存在屏蔽效率低且效果不稳定等问题,因此开