基于多尺度深度残差网络的行人检测算法

来源 :武汉大学 | 被引量 : 1次 | 上传用户:a7343022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、物联网、云计算等高新技术的快速发展,信息社会已经步入大数据时代。基于人工智能的数据处理方法在大数据时代具有优越性。行人检测是人工智能方法在视频大数据中的典型应用,其在视频监控、智能交通、机器人、自动驾驶等领域有广泛的应用,也是计算机视觉和模式识别领域中的重要研究方向。行人的身材、姿势、衣着和视角变化极大,光照变化、背景复杂以及摄像头自身的移动和晃动,都提升了行人检测问题的难度。近十年来研究人员主要采用了基于统计分类的方法,此类方法通过提取人体的各种特征,然后利用模式识别的方法进行分类。此类方法有效解决了行人检测中的诸多难点问题。然而,如何在背景复杂的场景下进行行人检测,解决小尺度行人检测和复杂背景误检一直是该领域的难点问题,该研究课题具有重要的研究意义与应用价值。针对该场景中存在小尺度行人以及复杂背景导致检测遗漏、出错的问题,文本提出一种基于多尺度深度残差网络的行人检测算法。首先,在整个行人检测系统中,运用深度残差网络构建行人检测模型,确保对行人特征进行精确描述;其次,在共享残差层后面设计浅层残差层、中层残差层和深层残差层,分别用于描述适合于小尺度行人、中尺度行人和大尺度行人的特征图;接着,设计多尺度目标提议网络,进行多尺度候选区提议,剔除了大量干扰背景,减少了检测代价,节省了计算时间;最后,设计多尺度目标检测网络,在候选区汇聚层中的特征图进行多尺度目标检测,增强了算法对小尺度行人的检测效果,提升了算法的检测精度。论文在INRIA和KITTI等公开数据集上对算法进行了测试。实验结果表明,该方法提高了当前流行算法对小尺度行人的检测精度,提升了算法的整体性能,增强了算法的鲁棒性。
其他文献
针对目前虚拟可信平台vTPM在云平台上缺乏安全有效迁移方案等问题,对虚拟机动态迁移和vTPM架构进行深入的分析和研究,结合QEMU本身迁移机制,设计了一种适用于云平台的虚拟可
近年来,随着云计算技术的快速发展,云计算也不可避免的产生了很多安全问题,如何在不可信的云环境中,为云租户提供安全可信的云服务,成为了学术界和工业界关注的热点问题。Int
质子交换膜燃料电池(proton exchange membrane fuel cell,PEMFC)作为燃料电池的代表,能够直接将化学能转化为电能,具有能量转换效率高、功率密度高、启动快、无污染等优点,因
碳化硅垂直双注入金属氧化物半导体场效应晶体管(Vertical Double-Implanted Metal-Oxide-Semicon-ductor Field-Effect Transistor,简称VDMOS)具有导通电阻低、开关速度快、
随着嵌入式设备的发展,嵌入式环境中出现了越来越多的信息安全问题,可信计算的出现为解决这些问题提出了可能。可信计算组织(TrustedComputingGrup,TCG)指出可信平台模块(Tru
稀有金属矿产对现代工业和科技发展至关重要,花岗伟晶岩在富集稀有金属元素成矿方面拥有巨大的潜力,对其成岩成矿作用的研究具有重要的意义。松潘-甘孜造山带花岗伟晶岩分布广泛,是我国伟晶岩型稀有金属矿的重要产区之一。容须卡伟晶岩型稀有金属矿床处于松潘-甘孜构造单元雅江-马尔康大型锂矿带上,目前,容须卡含矿花岗伟晶岩缺乏系统的岩石地球化学、年代学及同位素组成资料,且其与区内出露最大岩体黑云母石英闪长岩是否存
超分辨率作为图像处理领域一种重要的技术,其目的是获得更多的图像细节信息,提升图像价值。其主要优点在于可改善图像信号在形成过程中的降质问题,相对于硬件改进,其成本低廉
信息网模型起源于对大规模语义关联数据的建模,在信息网模型中抽象出了多种不同的关联类型,不但能够很好的描述数据的语义,还拥有对现实世界中对象的强大建模能力。为了方便
现实生活中的信息由于受各种主观因素和客观环境的影响,常常存在一定的不确定性。通过对不确定信息进行建模,能够有效地提取给定信息的本质特性,进而利用某些数学方法来分析
金属氧化物半导体材料由于其体积小、制作成本低和性能良好等特点被广泛应用到各个领域中,尤其是气体传感器方面。作为实现气体传感功能的核心部分,进一步开发与研究新型金属