基于学习的目标检测及应用

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:allenwyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测(Object Detection)是计算机视觉领域的一个基本问题,在非受控自然场景中快速准确地定位和识别特定目标是许多人工智能应用场景的重要功能基础。近年来,随着深度学习(Deep Learning)技术的快速发展,基于卷积神经网络(Convolutional Neural Network,CNN)的目标检测算法获得了关注和广泛研究,出现了很多性能优良、简洁高效的网络结构,使算法的大规模实际应用成为可能。当前,目标检测领域有几个主要的难点。首先,视觉场景中广泛分布着许多小物体,这些小目标的存在给检测算法的敏捷性、可靠性带来了挑战;其次,检测精度和速度存在着此消彼长的关系,兼顾这两项性能尚需突破许多技术瓶颈;最后,规模庞大的模型参数是制约深度网络片上装载的重要原因,在保证检测精度的同时压缩模型大小是一个有意义并且亟待解决的问题。本文主要针对检测模型局部优化、小目标检测、轻量级检测网络的设计和模型压缩三个问题展开研究,具体研究工作如下:1.在深度学习框架Caffe上实现了候选区域匹配池化算法并验证了算法的有效性。同时将区域匹配的思想推广到基于区域的全卷积神经网络中,提出了位置敏感的候选区域匹配池化算法,进一步优化了当前算法在小目标检测上的性能:2.基于SqueezeNet和Faster R-CNN检测框架搭建了小规模的通用目标检测网络,在PASCAL VOC 2007数据集上mAP达到0.533而模型大小控制在了 10MB左右。简化并实现了基于权值聚类的模型压缩算法,将模型进一步压缩到了 1.5MB而检测性能仅有微弱的损失;3.设计搭建了包含反卷积层和跨层特征融合的Faster R-CNN检测网络并将其应用到小目标分布较多的交通标识检测任务中,实验表明这一结构对优化小目标检测性能具有促进作用。在深度学习框架Caffe上搭建了目标检测领域较新的网络结构——特征金字塔网络(Feature Pyramid Network,FPN)并尝试复现其效果,在复现过程中探讨了关键技术细节的实现方式。实验表明复现情况并不理想。本文详细分析了可能存在的问题并且提出了改进方向。
其他文献
“社区矫正”作为一项新兴的刑罚制度,拥有着传统监禁性刑罚制度所不具有的优势,也摒弃了监禁刑所固有的一些先天性缺陷。另一方面,作为政府治理新理念的体现,“社区矫正”又
石佛寺是现今中国最大的和田玉加工集散地之一,同时兼有多种品类的玉石产品规模化销售。该区域玉雕产业集聚发展至今,已经形成了成熟的产业链,有着其独特的竞争优势,但也存在
<正>肝移植手术已成为国际公认的治疗终末期肝病的唯一有效方法。术后1年存活率已达90%,术后5年存活率达70%~80%。肝移植患者面临着术前病情危重,术中出血量大,插管、机械通气
翻译研究的几个问题吴义诚世纪之交,翻译学已经成为翻译界的热门话题,学者们建立翻译学的呼声也越来越高。翻译研究在二十世纪取得了长足的进步之后,终于有了自己十分明确的奋斗
随着超高层建筑的飞速发展,超高层建筑体型日益多变、建筑结构愈加复杂,建造难度越来越高,而与此同时,建设单位对工程工期的要求却越发严格,因此研发用于超高层高效建造施工
失重环境是地面上一种不多见的现象,在失重条件下,细胞间及细胞内部各结构间的相互作用消失或减弱。利用失重模型研究肿瘤,观察肿瘤细胞在失重环境中的生物学特性和分子表达,
文章分析了新疆生产建设兵团团场与连队冬季道路积雪形态及成因,结合团场动力配置情况,研制出了与拖拉机配套的小型清雪机。试验结果表明,样机对道路厚度小于30 cm的浮雪、压
文章以森林生态旅游业生态经济管理机制建设为研究对象,首先简单介绍了发展森林生态旅游业的作用,随后分析讨论了现代森林生态旅游业生态经济管理机制,最后提出了一些森林生
目的对比分析舌癌下颌骨骨切开术前术后咬合面积、咬合力及咬合力不对称指数的变化,探讨下颌骨“Z”形切开钛板单侧骨皮质固定对咬合关系的影响。方法收集2010年9月-2011年4
赵子龙(以下简称赵):你在一篇文章里提到,在不久的将来,中国画会经过一次世界性的繁荣,然后走向消亡,为什么会有这个观点?