基于多区域上下文信息指导的目标检测研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:zhuchao2549
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的浪潮兴起,相关研究进展十分迅速。尤其是卷积神经网络的发展,使目标检测任务取得了很大的进步。然而,目前的方法有两点限制:第一,大多数目标检测器应用正方形核进行卷积及池化,无法得到图像级别相距较远像素之间的关系,模型长距离依赖关系受限,检测长窄物体的能力差。第二,在多尺度目标检测中,目前的模型收集到的上下文信息有限,得到的结果精确度不够高。为解决以上问题,本文提出了多级矩形池化方法和级联上下文增强方法,通过收集不同区域的上下文信息加强特征,有助于后续的分类及回归任务。具体研究内容如下:本文提出了多级矩形池化方法:多级矩形池化单元利用多个矩形池化核进行池化操作,捕获图像级别的像素之间的依赖关系。与常规池化操作不同,矩形池化从不同的矩形区域收集上下文信息,以实现对尺度变化对象的鲁棒检测。本文还提出了上下文增强方法:级联上下文增强模块包含多个可变形卷积单元,能够有效地从不同尺度的多个区域内捕获局部上下文信息,实现多尺度目标检测。将多级矩形池化单元和级联上下文增强模块相结合,能够集成到不同的网络结构中提升性能。在MS COCO数据集上,将本文的模型融合到基于锚框Retina Net网络中,获得了1.9%的提升;将本文的模型融合到无锚框FCOS网络中,获得了2.1%的提升;在Pascal VOC数据集上,将本文的模型融合到Scale-aware Auto Aug网络中,获得了2.2%的提升。实验结果表明,本文提出的模块嵌入到不同的网络中均能提升检测结果,证明了模块的有效性和泛化性。
其他文献
铁是果树生长发育过程中十分重要的微量元素。由于土壤中的铁多以氧化物的形式存在,植物无法直接进行吸收利用,因此缺铁仍然是限制作物尤其是果树的产量和品质的关键。植物为了抵抗缺铁逆境,进化出两种生存策略。第一种策略存在于所有双子叶植物以及非禾本科单子叶植物,它们可以通过质膜H+-ATPase介导的质子外泌来降低土壤p H,将不溶性铁离子转化为可溶性铁,再通过IRT1(铁调控转运蛋白1)将可溶性铁运输到根
学位
蒙古族饮食文化是蒙古族智慧与创造力的结晶,也是中华民族传统文化必不可少的一部分。当前短视频发展迅速,蒙古族饮食文化依托短视频平台进行传播已经成为一种趋势。抖音短视频平台作为短视频领域中备受瞩目的平台,为蒙古族饮食文化的传播提供了新窗口。通过抖音短视频平台传播蒙古族饮食文化,可以扩大蒙古族饮食文化的传播范围,推动各地区网友对蒙古族饮食文化的关注和喜爱,促进蒙古族饮食文化的发展。本文由绪论、第一章、第
学位
2020年9月22日,杭州亚组委对公众发布了2022年第19届亚运会静态体育图标,本届亚运会体育图标根据竞赛项目分为竞技性比赛、球类比赛、水上比赛、对抗性比赛四大类,共计40个大项、59个小项,加上后期补充的霹雳舞、电竞共计61个小项。时隔两年,2022年8月8号,在此前已推出静态体育图标的基础上,杭州亚组委发布了2022年第19届亚运会动态体育图标,这也是亚运会历史上首套动态体育图标。在杭州亚运
期刊
蒙古语为第二语言学习用书的编译工作是属跨文化交际活动。第二语言学习用书中的称谓语往往体现所处文化环境中的伦理文化、交际文化以及价值取向。本文主要采用了文献收集分析法、采访法、比较研究法和统计法等研究方法。以19种第二语言学习用书为语料来源,对其中的蒙古语称谓语编译现状展开研究。将19种学习用书中所涉及到的称谓语按目标受众和种类进行量化统计,接着进一步分析蒙古语称谓语的编译要素,揭示第二语言学习用书
学位
本文以官方扎赉特旗媒介为研究对象,对扎赉特旗媒介进行了系统而全面的研究分析。扎赉特旗媒介事业以1952年的广播收音站建立作为起点,已有七十年的发展历史。在党的正确领导下,如今已有了自己的广播、电视、报纸、杂志,微信公众号、抖音、快手、微博、网站、新闻APP等媒介,形成了完善的媒介体系,也致力完成了媒介融合。扎赉特旗媒介作为中国共产党的基层媒介,时刻谨记自身义务,充分发挥党和人民喉舌的作用,正确引导
学位
随着科学技术的迅猛发展,人类社会步入了新媒体时代,新媒体的发展给传统媒体带来了巨大的压力和发展空间。在这种情况下,传统媒体开始采取新旧媒体融合的策略,探索自己的发展道路。本论文以呼伦贝尔蒙古语综合广播为研究对象,对其融合情况进行分析的同时,提出了融合发展存在的问题,相应的解决对策。呼伦贝尔蒙古语综合广播在探索媒介融合的过程中,与微信平台、App、网站进行合作,拓展了传播途径,在传播方式上使用音视频
学位
机会网络源于延迟容忍网络(Delay Tolerant Network,DTN),是一种消息源节点与目的节点之间无需存在端到端链路的、可容忍消息传递时延的自组织网络。机会网络的节点通过移动与其他节点相遇并建立短暂的通信链路,进而完成消息传输。在机会网络中,节点移动带来的相遇会使节点间形成社会关系,这种社会关系主要由节点在相遇时的具体交互情况决定,因此具有不确定性。在这种不确定社会关系下的基于节点间
学位
在智能感知领域中,由于当前主流的视觉和传感器解决方案存在隐私泄漏和覆盖盲区的缺陷,基于Wi Fi的无源感知研究逐渐兴起。其中,Wi Fi信号信道状态信息(Channel State Information,CSI)作为一种对当前物理空间中射频信号的精细度量,对空间中各种物理实体形状、位置以及朝向的变化极其敏感,为应用CSI进行包括用户手势和身份识别在内的智能感知提供了现实可能性。然而,当前基于CS
学位
随着人工智能领域的数据、算法和硬件算力的飞速发展,基于深度学习的计算机视觉技术取得了突破性进展。语义分割作为计算机视觉领域的热门研究方向之一,其获得越来越多的关注。近些年,语义分割取得了丰硕的研究成果,并广泛应用于自动驾驶、医疗诊断、图像编辑等领域。语义分割的目的是为图像中每一个像素标注一个对应的语义类别标签,这是一种密集分类任务。而语义分割中存在着两个主要挑战:第一个是图像中的物体呈现出尺度多样
学位
近年来,“拟物化”和“扁平化”一直是设计界热议的焦点话题,而质感设计是介于两者之间一种新兴的设计风格。探析质感设计形成的背景及其发展趋势,无论是在实践层面还是研究层面都具有较高的价值。许多开发者和设计团队已经开始重新设计自家的交互界面,跟上质感化的脚步,统一安卓的界面风格。谷歌作为全球最具代表性的互联网公司,其2014年6月发布的旨在统一三端的质感化设计风格在用户体验、应用现状、趋势走向等各方面都
学位