基于改进Cascade R-CNN的酒瓶缺陷检测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:a1218616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缺陷检测在纺织品、玻璃制品、钢材、道路交通、芯片等工业应用领域有非常大的需求,传统上一般使用人工和基于机器视觉的检测方法。但是,人工检测效率低、速度慢;而传统的机器视觉检测又需要依赖一些人为设计的特征,且鲁棒性差。近年来,随着计算机算力的提高以及深度神经网络的快速发展,使用深度学习方法,特别是使用目标检测方法进行缺陷检测逐渐成为研究热点之一。Cascade R-CNN是一个较新的、检测效果较好的二阶段目标检测算法。因此,本文基于Cascade R-CNN,并对其进行改进,对酒瓶缺陷进行检测,主要做了以下研究工作:(1)提出了一种使用候选框宽高比进行K-means++聚类的方法,对RPN网络中的候选框形状进行实验设计。结果表明,与基于数据分析得到候选框形状的方法相比,使用本文提出的候选框宽高比聚类的方法具有更好的检测效果。(2)针对数据集可能存在的噪声、样本不平衡等问题,通过图片剪裁、小目标过采样、缺陷拼接结合等多种数据预处理方式,进行组合实验对比,确定了数据预处理方案。使用本文提出的预处理方式对酒瓶数据集进行处理后,整体的m AP值提升2.6%。(3)针对酒瓶缺陷的特点,对Cascade R-CNN网络结构进行改进,并通过实验验证其优化效果。具体包括:把骨干网络由只有普通卷积的ResNet-50预训练网络替换为带有可变形卷积v2的ResNet-50预训练网络;FPN中引入了平衡特征金字塔结构,增强FPN中每层特征的语义信息;使用Guided Anchoring结构替换RPN结构,提取到质量更高的感兴趣区域;采用Focal Loss解决感兴趣区域采样不均衡问题;在R-CNN网络阶段,采用本文改进的OHEM算法进行采样解决样本不平衡问题;使用Soft-NMS替换NMS,使样本中可能出现的重叠缺陷目标保留下来。使用改进后的Cascade R-CNN网络进行检测时,虽然检测速度有小幅度下降,但是整体的mAP比经过数据集预处理后又提高了2.9%。
其他文献
大数据时代,张量得到极大应用,张量的有效表示逐渐成为研究热点。由于张量的“维数诅咒”,高阶张量分解在存储和计算成本上面临着极大的挑战。张量的Tensor Train(TT)分解已发展成为一种非常有效的张量表示,并且现已有稳定的TT分解算法。本文主要研究TT分解算法的加速方法。本文具体工作如下:(1)给出了σ--重排的定义,并理论上证明了σ--重排后的张量在TT形式下的基本运算仍然成立,如果运算结果
汽车的电动化、智能化的发展对汽车的制动系统提出了更高的要求,对于新能源汽车,真空助力制动系统需要安装真空泵来提供真空源,从而使制动系统体积过大;并且传统的制动系统不能用于协调再生制动和摩擦制动。对于智能汽车,真空助力制动系统无法始终保证主动制动功能。因此,开发新型电动液压助力制动系统及其控制是适应未来汽车的必然选择。依托课题组与企业的横向项目“电动液压助力制动系统开发”,论文在电动液压助力制动系统
本文利用WRF模式(Weather Research and Forecasting model)模拟研究短期、长期天气过程下,边界层参数化方案和精细化城市下垫面信息对北京市近地面气象要素和边界层结构的影响,并基于城市冠层参数对温度模拟结果进行改进。首先,选取2018年10月1日02:00至10月4日08:00的晴天过程,采用三层单向嵌套网格,模拟研究YSU(Yonsei University S
现代社会中心血管疾病严重威胁到人类的身体健康,如何实现心血管疾病的早期诊断是人们关注的重点。由于早期患者体内的生物标志物浓度低,对生物检测器件提出了特异性好和灵敏度高的要求。其中,免疫荧光检测由于操作简便、检测灵敏度高,应用十分广泛。同时,操作简单、成本低、响应快的即时检测(POCT)器件是当前生物传感器的重要发展方向。因此,将具有体积小、高通量、集成度高等优点的微流控芯片用于生物检测,可以实现生
基于逆Patch传递函数(Inverse Patch Transfer Function,i PTF)的声源识别法是近年来提出的一种近场声全息技术,可在嘈杂环境中对任意形状声源进行识别。该方法在声源周围假设虚拟声腔并施加合适的边界条件,从而建立声源面振速与虚拟声腔内声压的传递关系,求解声学逆问题得到声源面的振速信息。然而,该方法离散声源的识别会产生鬼影声源影响识别精度;在识别振动板件声源时会在固有
表格检测作为光学字符检测(OCR)的重要组成部分,在信息抽取中有着不可替代的作用。随着办公软件的普及,表格的样式越来越丰富,这也给表格检测任务带来了巨大的挑战。目前,快节奏的工作方式引导人工智能产品开发者提供一种便捷高效的服务模式,致力于将产品部署在移动端,为更多人提供便利。本文以多样式表格检测为目标,探索一种能够在边缘设备提供几乎无损服务的轻量化解决方案。本文的主要研究内容如下:(1)探索了一种
随着“互联网+”技术的不断进步,电子商务飞速发展,冷链物流日趋成熟,生鲜电商发展呈现良好的态势。然而由于生鲜产品易腐的特性,其损耗成本偏高,并且生鲜产品的运输和存储需要在低温状态下。居民消费观念开始发生转变,他们对于生鲜产品末端配送时效性要求更高,由此带来高昂的冷链配送成本严重制约着生鲜冷链的发展。基于以上表述存在的问题,生鲜前置仓模式应运而生。目前学者针对前置仓选址、前置仓末端配送方面的研究较少
在日常生活中人们会与智能手机发生各种触控交互,如点击、滑动、缩放等,由于这个交互过程容易受到各种因素的影响,因此会出现许多问题如年轻人在高频率的手机使用中手部肌肉损伤的风险变高、老年人在触控交互过程中容易误触等。所以了解触控交互如何受到影响具有重要意义,它可以帮助设计者更好的理解触控交互,解决用户日常出现的触控交互问题,提升用户交互体验。本研究选取了三个影响触控交互的因素:操作手势、屏幕尺寸、触控
双离合器自动变速器(Dual Clutch Transmission,DCT)具有手动变速器传动效率高、结构简单和价格便宜等优点,同时还克服了手动变速器换挡时动力中断的缺点,目前已成为车辆变速器领域研究的热点。本文以国家自然科学基金联合基金重点项目《考虑动态服役性能和驾驶行为及行驶环境的DCT智能控制与评价方法》的研究任务二“内外部激励下DCT系统动态特性研究”为依托,结合企业提出的动力总成悬置对
近年来我国雾霾天气总体呈现增加趋势,以硫酸盐气溶胶为代表的污染物颗粒是促使雾霾产生的重要因素,因此研究硫酸盐的产生以及演化机制一直以来都是一项研究热点,对于科学治理雾霾具有重要的意义。特别是从原子、分子层面研究小尺度磺酸团簇的电子结构对揭示其成核机理非常重要,然而磺酸阴离子在气相条件下十分不稳定,难以直接探测这一类阴离子的电子结构特征;此外,对于阴离子光电子能谱的模拟,缺少一种可靠的理论计算策略。