基于空间与时间上下文的深度学习目标检测算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：zjfjh2008

【摘要】

：

目标检测是计算机视觉领域的核心任务,其任务定义是通过紧密包围目标的矩形框定位出图像中的物体,并同时判别出其所属类别。目标检测技术既可服务于计算机视觉领域的顶层技术

【作者】

：

付志航

【出处】

：

浙江大学

【发表日期】

：

2004年期

【关键词】

：

目标检测深度学习空间上下文时间上下文自注意力聚焦背景消除非局部关联操作

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目标检测是计算机视觉领域的核心任务,其任务定义是通过紧密包围目标的矩形框定位出图像中的物体,并同时判别出其所属类别。目标检测技术既可服务于计算机视觉领域的顶层技术应用,同时也被直接应用于智能城市、自动驾驶以及智能医疗等领域,兼具学术科研与工程应用价值。近年来,学术界利用深度学习强大的语义表述能力,在目标检测算法的准确率与算法速度方面取得了突破性进展。然而,深度学习目标检测算法在不同的应用场景下依旧面临许多困难与挑战,如在多尺度检测算法中存在小尺寸框的错误检测现象,目标聚集场景中难以做到所有目标物体的正确检测,以及在真实世界的监控场景中目标检测算法难以同时做到抑制错误检测与提升正确检测等问题。本文根据目标检测算法面临的挑战,通过分别引入空间上下文和时间上下文信息,解决相应的问题。具体而言,本文的主要工作如下:针对多尺度目标检测算法中存在的大量小尺寸错误检测的问题,提出了一种基于预检测算法模块的目标检测算法,该算法模块相比于检测特征层位于更深一层的特征层中,拥有语义表达能力强和空间上下文信息丰富的优势,它用来对每个先验框潜在偏移的区域进行物体性预检测。实验分析验证了对同一感兴趣区域使用不同深度特征层进行独立检测流程切实有益于提升最终的检测性能,进而证明预检测算法模块输出的区域物体性置信度能够有效抑制小尺寸的错误检测数量,提升目标检测算法的总体性能。针对目标聚集场景中正确检测数量过少的问题,提出了一种基于视野膨胀与自注意力聚焦的目标检测算法。该方法使算法网络专注于候选框区域中目标物体所在的核心位置,降低候选框区域特征在目标物体聚集时出现的定位混乱问题,进而提升物体聚集场景下算法的正确检测数量。该方法在KITTI行人检测测试集的困难难度测评中,准确率均值达到74.8%,在截至目前的KITTI行人检测算法排行榜单中位列第一。针对真实世界的监控场景目标检测问题,提出了一种基于前景增强与背景对齐的目标检测算法,旨在做到同时抑制错误检测与提升正确检测。该方法为两步式目标检测算法,首先在第一阶段使用背景消除算法对监控视频的时间上下文信息加以利用,提取每帧图像对应的前景图像,并使用前景图像生成特征级别掩码,增强前景物体区域的特征表达,同时抑制背景区域的噪声响应。随后在算法的第二阶段使用成对式的非局部关联操作解决背景图像和原始帧图像之间的未对齐问题,完成对检测框的精准定位回归,提升算法性能。经过实验分析,该方法展示了其在抑制错误检测与提升正确检测两方面的优秀性能。

其他文献

玄武岩纤维透水混凝土性能试验研究

城市发生内涝,究其根源是不与自然环境相适应的建筑改变了地表径流方式,无形中增加了地下排水管网的负担。透水性铺装材料渗水效果良好,能够减轻城市的排水防涝系统负担。透

学位

透水混凝土玄武岩纤维透水系数骨料级配半经验模型

离子液体增效的新型固相微萃取涂层的制备、表征及应用

固相微萃取（solid phase microextraction,SPME）是一种新型样品前处理技术,因其具有萃取速率快、效率高、溶剂用量少、易于与其它仪器结合等优点而备受关注。目前已有一些商品

学位

固相微萃取离子液体碳纳米材料聚34-乙烯二氧噻吩金属有机框架

大气中臭氧损耗和燃烧过程中污染物间反应机理研究

用现有的量子化学理论和方法，精确地研究了大气中存在的自由基，活性原子和小分子与臭氧间的反应的机理；同时进行反应速率常数的理论计算，与实验结果对照：对于无实验结果的，进行了理

学位

臭氧反应机理过渡态分子轨道理论

普列汉诺夫社会心理理论的阐释学启示

普列汉诺夫的社会心理理论实现了马克思主义阐释的一次突破,它在一定范围内的阐释偏见性“共识”中崛起,成为当时马克思主义阐释的一个重要成果。这一理论在阐释方法上的突出

期刊

普列汉诺夫社会心理马克思主义阐释

某私募证券投资基金公司的价值投资策略研究

据中国证券投资基金业协会统计数据显示,截至去年年底,我国已备案的私募证券投资基金达一万三千余只,资金管理规模近两万亿元,较2014增长近3倍。随着我国政府越来越重视资本

学位

私募证券投资基金价值投资策略实证研究法战略管理

某1.2L发动机活塞优化设计

随着法规和客户对发动机日益苛刻的要求,活塞的设计及优化成为发动机开发的关键之一,活塞设计会影响到发动机的动力性能、寿命可靠性以及经济性。本文结合国内外活塞设计开发

学位

优化设计模拟分析二阶运动残余硬度

抗乙型脑炎病毒人-鼠嵌合抗体基因的表达

从分泌抗乙型脑炎病毒中和抗体的杂交瘤细胞株51-8的基因文库中筛选出的功能性重链和轻链可变区基因,分别与人y~3链恒定区基因和k链恒定区基因连接,构建成人-鼠嵌合的重链和

期刊

人-鼠嵌合抗体转染抗体基因表达乙型脑炎病毒

尼泊尔山区水资源可利用性与农户生计适应链框架研究——以柯西河流域为例

尼泊尔山区农业用水以雨水和山泉水(地下水)为主,灌溉设施普遍匮乏。在全球气候变化影响下,极端天气过程不断呈现,长期干旱和短时暴雨对农业生产的影响日益严重,直接影响农户

期刊

水资源可利用性生计适应链框架气候变化柯西河尼泊尔

煤层气藏复杂结构井三重介质渗流理论研究

煤层气作为一种重要的非常规天然气资源,在全球范围内储量较为丰富,是近四十年在国际上崛起的清洁、高效的化石能源之一。煤岩具有裂缝、割理和基质孔隙的三重孔隙网络;煤层

学位

煤层气渗流理论复杂结构井平面非均质点源函数

单根有机-无机杂化钙钛矿微/纳米线的滞后及存储性能研究

有机-无机杂化钙钛矿,如甲基胺碘化铅（CH3NH3PbI3）钙钛矿,由于其高功率转换效率和廉价的制备而在太阳能电池中拥有巨大的潜力。然而,它们的电流-电压（I-V）曲线通常表现出反常的滞

学位

有机-无机杂化钙钛矿微/纳米线量子点滞后行为阻变存储器载流子

基于空间与时间上下文的深度学习目标检测算法研究

与本文相关的学术论文