基于改进RPN的深度学习目标检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kyuiyigjghj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术在计算机视觉领域的广泛应用,目标检测作为计算机视觉领域中备受关注的前沿方向,涉及到图像中的检测和识别任务,应用于医学影像处理、图像检索、自动驾驶、人脸识别等各个场景。人们对目标检测的研究从早期的利用传统图像特征与机器学习结合的方法,逐渐发展为基于深度学习的方法。本文对基于两阶段的目标检测模型进行研究。此类模型在第一阶段由区域建议网络(region proposal network,RPN)提出候选正样本。训练该阶段的样本由图像中的目标位置与锚框(anchor box)的匹配后选取得到,导致模型被大多数匹配情况好的目标驱动,存在漏检的情况,对小目标及长宽比较大的目标尤为明显;其次,目标检测任务中的样本不均衡问题也会给模型训练带来较大影响。针对这些问题,本文基于两阶段目标检测框架中的经典模型Faster R-CNN算法,对RPN样本匹配和训练损失优化两方面展开研究,同时在工程中的病害数据集上实验,检验所提出的策略带来的目标检测效果提升。主要创新内容如下:(1)针对RPN阶段中样本提取和匹配不平衡问题,提出了一种改进的BRPN(Balanced region proposal network)算法。该算法给匹配困难的目标相应的正样本设定了自适应的宽松阈值,并且设置阈值策略拉开了正负样本距离,改善了RPN的样本提取质量,在匹配困难的目标类中检测性能提升明显。(2)针对网络的几何变换建模能力不足和不同类别数据不平衡问题,构造了一个新的目标检测网络。该网络使用Res Next和特征金字塔网络作为backbone,增强了网络的特征学习能力。为了提高网络的几何变换建模能力,提出将部分卷积替换为可形变卷积(Deformable Convolutional Networks,DCN);针对不同类别目标的数据不均衡问题,提出改进的B-Focal-loss损失函数。该损失函数比传统Focal-Loss更加注重当前阶段难分目标类,驱动模型自适应调整不同类的训练比重。改进的网络的漏检率与对少量数据的类别检测效果有显著改善。通过在测试阶段进一步结合Soft-NMS与多尺度模型融合等技巧,改进的目标检测网络在精度上取得了显著的提升。
其他文献
马克思社会有机体思想作为马克思主义理论的重要内容,在唯物史观中占有重要的地位。它揭示出人类社会是由其内部各要素相互联系而成的,是包含人与自然、人与人、人与社会关系
我国在经历石油、煤炭等不可再生资源的短缺之后,开始大力发展新能源。在这其中核能产业的发展是最为迅速的。随着核电业的发展,随之而来的是对于生态环境的深深忧虑。从上个世纪60年代起,全世界的核泄漏事件层出不穷,加剧了公民对核能行业的担忧,这也使得各国的核相关技术不断成熟。其中核废料的处置问题是世界各国都在科研的重要环节,如何制定一套完整的法律对核废料的处置进行规制也成为了各国的难题。目前我国对于核废料
毛泽东关于正确处理人民内部矛盾思想是毛泽东思想的重要组成部分,对国家政治生活具有重要指导作用,正确处理人民内部矛盾始终是中国共产党—以贯之的责任和使命。进入新时代,随着我国社会主要矛盾的转化,人民内部矛盾呈现出新趋势、新动向和新特点。在全面深化改革过程中,毛泽东关于正确处理人民矛盾思想仍具有不可替代的现实指导意义。我们要充分认识毛泽东关于正确处理人民内部矛盾思想的主要内容和当代启示,有效把握新形势
目的:幼年特发性关节炎(Juvenile idiopathic arthritis,JIA)是发生在16周岁以下儿童持续6周以上不明原因的关节疼痛、肿胀和(或)关节活动障碍,是儿童时期常见的一类风湿性的
【目的】探究18F-FDG PET/CT代谢参数与结直肠癌临床特征的相关性。【材料和方法】收集2012年到2016年在仁济医院核医学科行18F-FDG PET/CT检查的110例病理证实为结直肠腺癌
失智症作为一种以认知功能损坏为病症特征的不可疗愈综合疾病,正在世界老龄化趋势的催化下影响越来越多老年人的正常生活。北京市作为六朝古都,胡同社区不但承载了历史与文化,也是北京市老年人口最密集的区域,目前针对失智老人空间环境设计的研究,多从机构养老和家庭养老的角度入手,对失智照护机构和生活单元的设计方法进行探讨,而关于社区养老模式下的社区环境设计研究还比较薄弱,日托养老驿站基础下的社区养老模式作为兼顾
研究背景随着舒适化诊疗的发展,无痛气管镜诊疗广泛应用于临床,喉罩通气全麻是常用的麻醉方法。无痛气管镜诊疗术前患者常合并肺部感染需应用抗菌药物治疗。抗菌药在临床应用中会出现各种副作用和不良反应,这些副作用的表现及严重程度取决于所涉及的抗菌药物类型、相关的器官系统功能和药物的相互作用。对麻醉医生来说,抗菌药对神经肌肉系统的作用及与各种麻醉药,特别是肌肉松弛药的互相影响,最为临床关注。既往研究已证实许多
技术公司的入场行动正深刻影响着当前新闻场域多元行动主体的新闻实践。经由文化路径,本文以微信公众平台、百度搜索两类技术公司所开发的数字端口为研究对象,观察其入场新闻领域的行动实践,并透过两起争议案例关注技术公司入场背景下多元行动者间的关系互动。本文发现,进入新闻领域最初只是技术公司开发端口业务的“连带性后果”,但却在与新闻场域行动主体的互动中迅速发展;“打造内容平台”逐渐成为技术公司商业策略的重要一
移动数据业务爆炸式的增长对未来网络的系统容量和性能提出了更高要求,这使得对新型传输关键技术和通信方式的研究势在必行。毫米波通信与设备直连(Device-to-Device,D2D)技术作为第五代移动通信的两大关键技术,可以借助巨大带宽和短距离直接通信的优势提升网络容量和性能,两者的融合组网是异构网络的重要组成。在毫米波微蜂窝网络中引入复用模式D2D通信可以获得更高的频谱利用率,但是同时也给微蜂窝通
随着万物互联的推进,未来5G通信网络将要承载时延、速率和功耗等性能需求具有显著差异和极致要求的各类业务。与传统的LTE网络不同的是,5G在关注速率增长的同时,更加重视超低时延性能的优化。目前,现有网络基础设施存在承载能力不足等问题。为了解决该问题,网络切片(Network Slicing,NS)技术被提出,其通过将物理网络划分为业务和资源隔离的逻辑网络,能够提供一网多营的服务能力。在这种多并发业务