基于ResNet的严重遮挡行人检测研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:sunku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于卷积神经网络(Convolutional Neural Network,CNN)的行人检测研究取得了显著成果,但是目前已有的行人检测技术还不能完全应对严重遮挡的场景。Res Net在特征提取过程发挥了重要作用,因此广泛应用于目标检测等计算机视觉任务。本文针对密集场景下严重遮挡的行人检测问题展开研究,以Res Net为骨干网络,主要包括改进Faster R-CNN的两阶段多尺度检测网络和改进Retina Net的一阶段单尺度检测网络。完成的工作如下:(1)针对严重遮挡的行人检测问题,本文基于Faster R-CNN两阶段检测网络,提出多尺度特征金字塔网络框架(Multi-Scale Feature Pyramid Network,MFPN)。引入了头部检测方法,由一个候选框回归得到两个预测框,有效降低严重遮挡行人的漏检率。为了更好地提取严重遮挡行人的特征,提出了一种Double FPN(Feature Pyramid Network)网络,在特征提取和融合阶段较好地增强了遮挡行人的语义信息和轮廓。为了有效分离预测框与其他目标的真实框,本文引入斥力损失,进一步提高遮挡行人检测的准确率。(2)为了解决MFPN中多尺度检测内存占用大以及两阶段检测网络耗时长的问题,本文基于Retina Net网络提出一种单尺度检测网络。将特征金字塔的多入多出结构改进为单入单出结构,该结构由四组扩张率不同的膨胀卷积组成。在单尺度特征上利用简化后的解码器进行检测;同时引入均衡匹配方法,为每个目标行人匹配四个锚框,避免了被遮挡行人尤其是较小目标匹配不到锚框的情况。在公开Crowd Human数据集上的实验结果表明,改进后的两阶段网络检测准确率提升了5.16%,检测速度基本不变;改进后的一阶段网络检测准确率提升了2.81%,并且检测速度FPS由2.9提升到4.3,证明了本文方法的有效性。
其他文献
脑肿瘤是一种全球死亡率较高的疾病,对病变组织范围的界定是对脑肿瘤定量评估和制定治疗计划的一个主要挑战。近年来,基于核磁共振成像(Magnetic Resonance Imaging,MRI)的脑肿瘤分割研究因其无创成像和良好的软组织对比度而受到越来越多的关注。核磁脑肿瘤分割是指,基于脑部核磁共振影像,将坏死细胞、水肿、活跃细胞从脑脊液等正常组织中标记出来,从而确定肿瘤范围的过程。目前,常规临床中采
随着我国经济快速发展,交通拥堵问题日益严重。为改善交通拥堵现状,国内外学者积极寻找有效的对策,其中一种有效方法是建立交通出行需求预测模型,分析和掌握居民出行选择的一般规律,进而有效管理城市居民的交通出行。出行目的是引发交通需求的直接原因,研究出行目的对分析居民出行行为具有重要作用。随着机器学习的发展,全连接神经网络展现出其强大的自主学习能力和精准的预测能力,给非集计模型在交通出行行为领域的研究提供
随着人工智能、机器人技术的不断发展和变革,机器人正逐渐进入人类生产生活的各个领域,机器人操作系统(Robot Operating System,ROS)因此得到广泛的应用并受到学术界和产业界的共同关注。其中,ROS安全测试与验证成为机器人操作系统研究领域的热点问题之一。通信机制作为ROS最基础的功能,在保证系统的正确性和安全性方面具有不可替代的作用。进一步说,ROS安全不仅应当从仿真和测试出发来进
移动机器人已广泛应用在医疗服务、餐饮行业、物流运输等领域,先进的机器人技术逐渐代替人工作业。移动机器人的路径规划与轨迹跟踪是机器人自主导航的关键技术,其运动路径是否平滑影响着机器人的移动效果,能够生成符合车辆运动学的可行路径并且稳定跟踪控制是实现的移动机器人自主导航的基础。本文从移动机器人的实际问题出发,以松灵SCOUT通用型底盘为实验平台,在工控机上安装Ubuntu系统,搭载16线激光雷达和IM
随着移动机器人技术的飞速发展与相关研究的逐步深入,移动机器人拥有了更加广阔的应用背景,由此对其结构和功能提出了更高的要求,期望移动机器人具备一定的环境适应性以应对复杂的工作环境。移动机器人的越障能力测试是移动机器人研究过程的关键一环,然而在传统的越障能力测试试验当中,常规方法是让移动机器人跨越特定参数的障碍试验台,再通过人工判定的方式测试其越障性能。由于特定参数的障碍试验台不能根据越障试验需求快速
随着现代电力系统的快速发展,新能源大规模并入电网,特高压交直流混联趋势日加明显,电网互联程度日趋紧密,这使得电力系统规模不断扩大,复杂性大幅提高,愈发接近安全稳定运行极限。且现代电力系统高维非线性,故障发生速度快,响应时间短,这无疑加大了暂态稳定预测的难度。为给故障后的紧急控制留出充足的时间裕度,亟需一种更加快速准确的暂态稳定预测方法。近年来,以数据挖掘和机器学习为代表的人工智能领域得到了迅速发展
随着精神生活的日益丰富,人们对观看电影、电视剧的娱乐需求逐渐增加,以微电影、情景剧为代表的网络短视频也呈爆炸式增长。在这一环境下,预测观众在观看影视作品时视线聚焦的位置变得十分有意义,例如,对于广告公司来说,通过视频中的注视点分析,可以将广告产品在视频中的位置设定的更佳合理。依据观众是否提前知道影片的相关信息,观看方式可分为自由观看和视觉问答两种。现有的动态场景人眼注视点数据集几乎都不是针对影视作
细粒度图像分类在工业界应用广泛,然而,传统的图像分类网络在细粒度图像的分类问题上往往无法达到很好的效果,因为在细粒度图像的数据中经常会出现高类内差,低类间差的情况,加之图像数据的质量参差不齐,图像中存在的噪声往往会掩盖图像内部的细节特征,因此细粒度分类问题十分具有挑战性,也引起了广泛的关注。然而细粒度图像分类网络运用于工业仍面临挑战。在目前的研究中,强监督的细粒度分类网络虽然有着较高的准确率,但却
联邦学习是一种新型的分布式学习框架,它能够解决数据在本地训练而不会泄露的问题,但是它也面临一些前所未有的安全和隐私威胁,例如在传统机器学习中的投毒攻击可以很容易的在联邦学习中实施,因为本地数据对外不可见,恶意的参与者就可以轻易对数据进行篡改实施投毒攻击。另外由于服务端与本地客户端通过模型参数进行通信,恶意的参与者可以直接获取到参数,通过对这些参数进行分析,依旧可以在一定程度上泄露私人信息。因此本文
互联网已经迅速成为日常生活中不可或缺的一部分,并且我们对互联网的依赖正在持续增长。与此同时,网络攻击急剧增加,攻击手段日异月更。当前的恶意代码检测技术通常使用传统的机器学习算法,这些算法需要对恶意代码特征进行提取和选择。多数动态分析受执行环境约束,部分恶意代码通过隐藏文件逃避追踪,过程耗时且容易出错。流行的静态分析依赖于人工提取特征,安全性较差,效率较低。面对以上挑战,本文将恶意代码检测结合深度神