基于改进R-CNN的X-ray图像胸部异常检测研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:niuniuplayplay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
X-ray图像成像成本低,具有低辐射剂量,并对各种病理有着合理敏感性,因其高可用性,成为现代医学图像的“流量入口”。近年来,深度学习技术逐渐成为医学图像分析领域的自然选择,可以通过设计并实现不同的计算机视觉模型辅助解读医学图像,为医生提供可靠的第二诊断意见。胸部X-ray图像作为最常用的放射学检查,是筛查、诊断各种心、肺部异常的核心辅助手段。利用深度学习技术辅助胸部X-ray图像的解读,尤其是准确检测出异常的类别和位置是一个具有重要研究价值的研究方向,但这种细粒度辅助诊断任务存在着一定的挑战性。一方面,由于X-ray图像的成像特点,图像中的异常区域和自然图像中的显著目标相比具有更少的判别性特征,使得检测模型准确区分不同的病理模式变得非常困难,如肺炎和胸腔积液都表现为X-ray图像的不透明性增加。另一方面,胸部X-ray图像中包含的异常往往尺度多变,且包含难检测的小目标,如肺结节。除此之外,不同类别的异常数据呈现出明显的长尾分布特点,给模型的多标签平衡训练增加了困难。针对以上三方面的问题,本文提出了有效的解决方法,主要研究内容如下:1、针对胸部X-ray图像中判别性特征提取困难的问题,设计了通道维注意力与空间维注意力引导的特征提取网络Aug-Res Ne St。其中,通道维注意力通过自适应重组不同通道的特征,实现了通道信息的有效交互,过滤了冗余特征而保留了重要特征。空间维注意力利用可变形卷积打破规则感受野的限制,灵活提取目标周围的上下文信息作为对通道维注意力的合理补充。通过在特征提取网络中使用双重注意力引导机制,有效提升了其对判别性特征的提取能力,从而将本文检测模型对14类异常的平均检测精度提高了1.7个百分点。2、针对胸部X-ray图像中异常尺度多变的问题,提出了使用增强特征金字塔结构Aug FPN作为特征融合网络。该结构通过提出残差特征增强、一致性监督和软性Ro I选择等模块解决了原始特征金字塔网络中存在的顶层特征信息损失、不同层特征语义差距大、多尺度特征利用不充分等关键性问题。实验证明该结构的引入有效改善了本文模型整体的检测性能,将模型对14类异常的平均检测精度从33%提升至34.1%。3、针对不同类别的异常数据呈现出长尾分布的特点,使用Seesaw Loss作为分类损失,它在常见的分类损失Cross Entropy Loss中引入了两个关键因子。在训练过程中动态减少了由长尾分布中的头部类别施加在尾部类别上过量的负样本梯度,达到了正负样本梯度相对平衡的效果,从而避免了因类别分布不均衡而产生的分类器学习偏向性问题。实验证明,采用Seesaw Loss作为分类损失可以有效提升并均衡模型对不同类别异常的检测性能,将本文模型性能提升了0.8个百分点。通过对以上三个关键性问题的解决,在Vinbigdata数据集上的实验表明,本文所提出的胸部X-ray图像多标签异常检测模型具有良好的表现,最终取得了36.2%的平均检测精度,超越了大多数现有的流行两阶段检测器。
其他文献
2019年8月26日十三届全国人大常委会表决通过《土地管理法》修正案,自2020年1月1日起施行。新通过的《土地管理法》规定集体经营性建设用地可以入市,给估价机构带来了机遇,同时也给估价师的执业风险带来了巨大的挑战。如何做好集体经营性建设用地入市的估价服务,提高估价师执业能力及防范执业风险,是新形势下估价发展应密切关注的问题。
会议
图像语义分割是近年来人工智能领域中的一个重要研究内容,其目的是对输入图像进行逐像素分类。在基于全监督的图像语义分割任务中,需要提供逐像素标注分类的真实分割标签,目前这些标签都是由手工标注,耗费了大量的物力、人力资源。因此标注信息更容易获取的基于弱监督学习的图像语义分割方法受到越来越多研究者们的青睐。弱监督标签主要包括边界框、线、点和图像级标签等。在本文中,鉴于图像级标签的最低获取成本,因此将其作为
学位
为有力保障海洋生态修复项目建设以及实现高效片区治理,文章以洞头蓝色海湾修复项目为例,详细分析政府和社会资本价值创造和价值捕捉(PPCC)模式的运行方式,并总结其经验启示。研究结果表明:蓝色海湾修复总体表现为片区开发,且具有很强的公共物品属性和外溢效应,应用PPCC模式是对政府和社会资本合作(PPP)模式的重要创新;通过参与主体的动机凝聚和资源互补创造多元价值,根据不同参与主体的价值捕捉机制实现合作
期刊
多形性腺瘤是一种恶性程度较高的肿瘤,经常发生于口腔、颌和面部。多形性腺瘤也就是混合瘤,是一种分为腺管、黏液组织、软骨组织和肌上皮细胞组织的腮腺肿瘤。由于多形性腺瘤一般没有症状,表现为无痛、生长相对较缓慢,大多数肿块都是不经意间体检发现,病程甚至长达十多年,严重影响着人类的生命和健康,所以多形性腺瘤的治疗成为了大家关注的问题。现阶段通过电子计算机断层扫描(CT)检查、超声诊断(B超)和核磁共振成像(
学位
为了考察小学生高年级体育锻炼行为、学习拖延之间的关系,采用体育锻炼评定量表、小学生高年级学习拖延量表,对367名小学高年级学生进行了调查。结果表明:体育锻炼行为与学习拖延呈显著正相关;结论:学生的体育锻炼水平能够影响学生学习拖延,提高学生体育锻炼水平能够改善学生学习拖延的情况。
会议
随着在线社交信息的蓬勃增长,易于获得的社交信息已经被广泛应用于推荐系统,来缓解传统协同过滤中的数据稀疏性问题。然而如何充分的将社交信息融入到模型中使得最终的嵌入表示能力获得提升是学者们一直在研究的问题。由于用户在社交网络以及用户-物品交互网络中都扮演着重要的角色,目前许多研究通过图卷积神经网络建模了两个网络上的信息扩散过程,再经过信息融合来获得高阶的信息。但这种建模方式存在三个问题,一是未对一些潜
学位
<正> 自从人民日报发表了,湖北省中医学院第二届西医离职学习中医班的集体论文“从脏腑学说来看祖国医学的理论体系”之后,迄今已整整两年,在此期间,引起了我国广大中医界同志们的深切关怀,从其所发表的意见来看,绝大多数同志是同意他们的提法的,认为它的基本观点是正确的。当我细心地阅读了,杨麦青同志的“脏腑学说是中医理论体系的核心”(健康报
期刊
随着工业4.0时代的到来以及科技进步和发展,智能驾驶系统正在蓬勃发展,人们也越来越关注驾驶安全。对于驾驶员来说,大量交通事故是由于情绪的波动所导致的,所以准确识别驾驶员的情绪是件非常重要的事情。对于情绪识别这项任务,在可控的实验条件下已经取得了很好的准确率,即针对完整的正面人脸。这意味着在不同光照、不同姿态、不同分辨率、存在不同遮挡的非受控自然环境条件下,情绪识别不尽如人意。同时在部分遮挡下的情绪
学位
<正> 人类在发展过程中,为了要健康的生活和繁衍种族,就要不断地和危害生命的疾病作斗爭,这个斗爭也就是认識、了解、以及防治疾病的过程。随着人类物质文化的进步,这个认識过程也就日益深入。但由于处在不同的历史时
期刊
皮肤恶性肿瘤是一种常见皮肤疾病,在世界范围内都有发病案例,皮肤恶性肿瘤的种类很多,包括基底细胞癌、鳞状细胞癌以及恶性黑色素瘤等。在信息化的今天,合理使用计算机技术辅助医生进行皮肤恶性肿瘤的诊断具有重大意义。目前对于皮肤恶性肿瘤的分类诊断是使用人眼等直接观察,存在许多主观因素的干扰,为疾病的诊断增加了难度以及不确定性。因此,使用深度学习的图像分类技术配合其他技术手段,实现准确率高、分类速度快同时模型
学位