基于卷积神经网络的小目标检测方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:gen19gu86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是视觉领域研究的重要方向,在多个领域中有重要的应用价值。目前检测在背景嘈杂条件下,由于受到遮挡、光线不足等条件影响,目标发生形变,导致对模型的要求也日益提高,需要克服更多难题与干扰来提高其鲁棒性。如何在多种因素的影响下设计一个能精准识别目标的模型,成为该领域的重中之重。
  早期结合滑动窗口与图像缩放的算法检测成本高、效率低,多数高效算法都是基于卷积神经网络(CNN)被提出,虽在一定程度上控制了算法开销,并提高了对通用目标的检测准确率,但在对小尺度目标检测时效果仍不理想。研究发现,网络低层的特征图分辨率虽高,但抽象语义不足;高层的特征图因多次降采样操作使得尺寸变小但有丰富语义信息,造成边缘细节和目标定位相关的信息有所缺失。对实际尺寸较小的目标检测时,对特征的表达能力有更大需求,在较低层的特征图上进行更精密的采样,利用较深层的语义对目标的特征弥补。为此本文针对以上难题提出一种对稠密连接块之间全连接的方法融合各层级特征,对较浅层的特征做精密采样,生成的特征语义信息更丰富。本文研究内容如下所述:
  (1)针对现有算法对小尺度目标的提取特征不充分、在部分场景中目标存在对图像占比小、特征易丢失、检测精度低的问题,提出一种对稠密连接块之间全连接的方法融合各层级特征,实现对各层特征信息的复用,在一定程度上弥补模型提取特征的信息缺失,得到了更具鲁棒性的特征提升检测精确度。
  (2)在网络中参考残差结构思想,设计增加类似卷积与反卷积结构(Convolutional-Deconvolutional Network)超分辨率技术,通过一种跳跃式的短连接来达到修正proposal位置的目的,加强模型对目标定位的性能,加快网络的收敛速度,并用RoIAlign来避免区域不匹配多带来的损失,降低对计算力的需求,改善模型对较小目标检测的精度。
  (3)针对图像中小目标边界模糊不清、背景和噪音占比大,难以检测到弱小目标的问题,借鉴SENet的思路,增加MSC模块优化提取特征,对网络最终输出的特征,同时在通道(channel)和空间(spatial)维度上,增加注意力机制来进一步地提升检测精度。
  此外,本文实验均使用公认数据集,设计消融实验对比,验证改进模型对尺寸较小目标的检测有效性。我们的方法提取特征更具鲁棒性,检测质量更高,在mAP达到81.6%的同时AP(如bottle等)提升到72.4%,相比其他代表性算法有明显的优势。
其他文献
农田稻谷飘香,堤岸风车转动,宽阔的柏油路一路延伸,整齐的农房掩映在碧荷秀水间……走进金湖县,一幅美丽的田园画卷展现在眼前。   近年来,金湖县立足自身资源禀赋和发展优势,加快建设更富魅力的现代化水韵湖城。大力实施“融入融合、双招双引、美丽生金、共富共享”四大战略,全力推进“产业扩量提质、生态特色彰显、城乡内涵提升、动能集聚迸发、百姓幸福安康”五大工程,致力于美丽生金,让共同富裕真正“看得见摸得着”
期刊
近年来,人工智能技术开始逐步地落地到智能驾驶行业,衍生了一些先进的汽车辅助驾驶系统。但这些系统针对的主要对象是机动车及驾驶员,对行人和骑车人的保护依然有限。现有的行人和骑车人检测算法采用两个单独的检测器分别进行检测,常导致两类目标的检测结果混淆。而现实的道路环境复杂多变,检测目标存在尺度变化,相互遮挡等问题,传统的检测方法仅适用于简单和单一的检测环境,无法满足现在道路环境要求。针对上述问题,本文利用深度卷积神经网络,特征融合和注意力等技术,对道路行人和骑车人检测算法进行研究。具体研究内容如下:
  
作为用户创建和分享信息的平台,社交媒体已经成为人们生活的重要组成部分,每天越来越多的人通过社交媒体发布海量的多媒体内容以表达自己的观点和情感。针对这些用户生成数据的情感分析能够有效分析用户行为和心理,发掘用户需求,具有重要的应用价值。随着社交媒体中用户发布的视觉内容日益增多,视觉情感分析引起了广泛关注。
  与目标识别任务不同,图像的情感识别是一种更加抽象的任务,其关键在于提取判别性的视觉特征。深度学习方法能够从大规模数据中自动学习特征,被广泛应用于视觉任务中。目前已有研究将深度学习技术与视觉情感分
大数据时代对传统存储系统的各项性能提出了全新的挑战。由于传统存储系统在大规模数据存储方面存在诸多缺陷,如系统扩展性差,数据安全性低,部分节点读写压力过大等,所以分布式存储系统凭借其优秀的可扩展性,可靠的数据安全保障机制,以及大规模读写操作时出色的吞吐性能等,成为当前大规模数据存储领域的主要解决方案。但因为分布式存储系统的底层设备普遍采用廉价商用硬件,故障率较高,所以会通过应用冗余策略来保障存储系统中数据的安全性。
  与传统副本冗余策略相比,纠删码能够在同等冗余需求的前提下,尽可能的降低整体存储开销
“三塘拥田舍,悠然见曹山。”这是溧阳市上兴镇牛马塘村的原乡风貌。牛马塘地处丘陵地带,村中植被覆盖率高,有大片的原始松林及梯田,自然风景优美。中心村落被牛马塘、上兴塘及雅雀塘三大水库所包围,村庄保留着纯农业田园环境,为溧阳鱼米之乡的典范。   曾经,这里的村民们家家户户种植红薯,也有着传统的竹编、酿酒等技艺,但随着市场经济发展,青壮年纷纷外出务工,牛马塘渐渐成了“空心村”。2017年,牛马塘入选江苏
期刊
近年来,得益于移动互联网的不断发展,人们的日常生活以及工作越来越方便。在旅游出行方面,人们可以通过网络来获取相关旅游服务信息。然而随着网上用户的增长,使得互联网的数据急剧增加,用户需要耗费大量时间去查询相关的旅游信息,造成了极大不便。推荐系统可以有效地处理上述存在的“信息过载”问题,为用户提供兴趣点推荐服务。
  在旅游推荐领域中,传统的兴趣点推荐算法虽然取得了良好的效果,但这些方法比较依赖浅层特征设计,不能全面地学习用户和兴趣点的深层次特征,并且传统推荐模型存在数据稀疏和推荐效率低等问题,会影响推
边缘计算是一种新兴的计算架构,能为低延时和高带宽需求的应用提供更好的性能的改进。边缘计算作为云计算下沉到用户侧的部分,能高效的发挥数据汇聚的作用,边缘计算协同云、终端,进而对海量数据进行分析和控制。5G技术解决了网络接入的问题,而没有解决骨干网和城域网带宽和延迟问题。不计其数的5G智能终端和物联网终端的连接会造成带宽资源的抢夺,因此,云、边和端节点间的通信仍旧面临阻塞的网络问题,而边缘计算是一种很好的解决方案。
  基于互联网的在线多媒体视频(长视频和短视频)逐渐取代传统电视,新规格的视频形式(4K
电子计算机断层扫描(ComputedTomography, CT)检查是疾病诊断的一种重要手段。为了给当前患者做出稳定可靠的疾病诊断,医生往往需要参考历史病历的CT图像。然而,面对庞大而复杂的CT图像数据库,如何高精度地检索出医生所需的CT图像已经成为当前计算机辅助诊断技术迫切需要解决的问题。CT图像因病变形状各异导致传统的基于单一底层视觉特征的CT图像检索结果不尽人意。因此,为了提高CT图像检索结果的准确率,本文从多特征角度出发来研究CT图像的特征表示,并提出了两种基于多特征表示的CT图像检索算法。
由于我国人口老龄化和城市建设化进程不断加快,公民受环境和生活方式的影响也在加深,导致患心血管病的人数持续增加。临床上用于心功能检测的医疗仪器和方法不能实现非接触和无创采集的要求,虽然这些方法产生了不错的效果,但在检查过程中会对身体产生些许伤害。因此开发一种无创便捷式的家庭心脏监护系统显得尤为重要。
  心冲击信号(Ballistocardiogram,BCG)是心脏收缩和舒张时对血管冲击引起的身体微小震动,反映出心血管系统的状态。对BCG信号的分类进行研究,能够有效预防心血管疾病,同时有利于合理分配
“月季满墙,一路芬芳,油菜花染醉了小窗,竹里潇湘,静荷沉香,明月照亮了诗和远方。”这是张小燕写的歌《云沧海的小时光》里的开篇歌词,歌中写到的竹里、静荷、沉香、明月都是小院的名字。这首歌是中国首届农民丰收节庆典首播歌曲,被央视多次播放。   张小燕,作家、摄影家、企业家、慈善家、致公党员、政协委员、新阶层人士……她的头衔太多,而她最想让大家记得的,也是最令人印象深刻的,是她用美丽情怀做好美丽事业。 
期刊