基于上下文的卷积神经网络多物体检测算法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:Y514027468
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测在图像识别与计算机视觉领域中是一个比较热门的研究方向,在诸多领域中,均有着广泛的用途。在自动驾驶领域,通过物体检测来合理的规避行人和车辆;在图像处理领域,图像分类,语义分割,场景理解等任务都是建立在物体检测之上的;所以,物体检测任务研究有着重大的意义和广泛的发展前景。目前,单帧图像中的物体检测任务已经步入正规,部分检测算法已经达到实时处理的检测效果,但是由于该方法不是专门为视频检测所设计的,所以将单帧图片的检测方法直接应用到视频中的多物体检测任务仍然存在许多问题。因此本文主要从两方面对视频中的多物体检测任务进行研究,为了适应多物体的形态多样化改进了基于卷积神经网络的物体检测算法,为了提高物体检测的精确度融合了上下文信息进行多物体检测。在基于卷积神经网络的物体检测方面,主要从提取候选区域及检测窗口的抑制算法这两个方面进行改进。首先介绍了两种提取候选区域的方法并且分析了其优缺点。现有的提取候选区域方法计算量大,重叠区域多,并且不能很好的适应多物体检测任务中物体的形态多样性。本文提出了多尺度特征下提取候选区域算法,关注物体在多个层次上的语义信息,降低多物体检测中小物体被漏检的概率。在检测框抑制算法上,本文针对现有的抑制算法对相邻较近的物体无法有效判断的现象,提出了基于中心点的非极大值抑制算法,通过判断检测窗口的中心点距离来抑制冗余的窗口,从而降低出现漏检的概率。在视频中的多物体检测方面,本文首先介绍了视频中多物体检测存在的问题,由于视频序列由连续的多帧图片所组成,因此基于视频序列的多物体检测与基于单帧图片的多物体检测有着很大的相似性,但是由于单帧图像的检测算法未考虑视频序列的上下文信息,在视频序列中,对于同一个物体具有丰富的相关信息可以利用,因此本文提出将上下文信息融入卷积神经网络多物体检测中,利用相邻帧间的相关性来提升当前帧物体检测的准确性,该算法能够提高视频中多物体检测的准确率,但因处理了更加复杂的问题算法的复杂度会上升。
其他文献
由于计算机科学技术的飞速发展,使得网络越来越复杂和多样化,这给网络和信息系统的安全管理带来了新的挑战。单一使用“检测”、“容忍”网络和信息技术难以保证网络在无干扰
介数中心性计算是复杂网络分析中的一个基本问题,它用来衡量一个节点在复杂网络中的重要程度。近年来,介数中心性已经广泛用于社交网络分析,打击恐怖组织网络,治理城市交通网
优化问题无处不在,与人们的生活息息相关。为了高效地处理优化问题,群智能优化算法应运而生。生物地理学优化(Biogeography-Based Optimization,BBO)算法是群智能优化算法之
数据抽样是一种从样本总体中选择部分有代表性的个体进行分析的推论统计方法。通过对抽取样本的属性进行观察,数据抽样技术可以对样本总体的特征做出一定的估计和判断,以达到
能源是人类生存发展的重要物质基础,能源互联网作为未来能源可持续发展的解决方案已经成为热门的研究课题。其中,能源互联网架构设计的相关研究对能源互联网的发展最为重要。
建筑幕墙以其靓丽的色彩在建筑装饰工程室外装饰中的应用越来越广泛,但是在应用中也会存在这样和那样的问题。本文通过建筑幕墙的发展与应用范围,分类等论述,指出了建筑幕墙
随着计算机应用领域的丰富与扩展,图作为常用的数据结构之一,现实世界的诸多领域均用图来描述其复杂而庞大的逻辑关系,如社交网、生物信息网、智能交通网等新兴领域的建模。
随着类脑计算在学术界和产业的热度持续高升,研究生物智能与机器智能深度融合并协同工作的新型智能系统,是当前人工智能与脑认知科学交叉领域面临的重要课题。智能体技术源于
在医学领域中,医生常常对同一个病人在多种模式下的成像,或者在同一种模式下多次成像的结果进行配准,这个过程可归属于数学物理领域中的反问题,而反问题大部分是不适定的。自
随着互联网新型应用技术(如云计算、大数据、IoT、NFV等)的革命式演进,这波数字化转型催化了用户对海量资源信息(如视频、社交图像分享等)的获取需求,流量应用和网络服务也发