基于机器视觉的行人检测方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:star010lxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是机器视觉领域的一项重要研究课题,在智能交通、行人重识别、行为分析、智能机器人等场景中发挥着关键作用。为了准确、快速、稳定地检测各种场景下、各种姿态、各种尺寸的行人目标,众多行人检测算法相继提出。本文在前人工作的基础上,深入研究了多种基于视觉的行人检测方法,并提出了相应的改进方法,主要工作如下:首先,提出了一种基于选择搜索(Selective Search,SS)算法和可变形部件模型(Deformable Part Model,DPM)的行人检测方法。采用选择搜索算法提取候选区域,充分利用图像的颜色、纹理等多种特征信息,同时减少了大量冗余窗口,有效降低了计算量;使用可变形部件模型,对候选区域进行目标匹配,有效应对行人检测问题中的多视角以及目标形变问题;将行人目标各个部件的位置分布作为隐变量(Latent Variable)送入分类器训练,充分利用图像中的未标注信息。实验结果表明,该方法对不同视角、不同姿态的行人具备较好的鲁棒性,且一定程度上提升了检测速度。其次,提出了一种基于深度可分离卷积(Depthwise Separable Convolution,DSC)和SSD(Single Shot Multi Box Detector)算法的行人检测方法。使用Mobile Net作为基网络,并在检测端引入DSC模块,成倍减少了模型参数量和计算量,从而达到平衡检测精度与检测速度的目的;使用转置卷积进行上采样,使得模型更加关注浅层细节信息,从而弥补经典SSD算法对小尺寸行人检测效果不佳的缺失;另外,在检测中,使用K-Means算法对真值框进行聚类得到先验框尺寸,使得算法对行人目标更具针对性,进一步提升网络的整体检测性能。实验结果表明,该方法漏检率更低,对小尺寸行人的鲁棒性更好,且在模型大小、计算量及检测速度上都具备一定优势。最后,提出了一种基于轻量级卷积神经网络的行人检测方法。利用并行连接的思想搭建一个特征提取基网络Parallel Net,并在网络结构中使用Fire模块,减少模型参数,达到模型参数量与特征拟合能力间的平衡,同时有效缓解了因网络层数过深而带来的梯度消失等问题;使用卷积层直接进行检测,进一步减少了计算量;在训练过程中引入Focal Loss,以解决正负样本极度不均衡的问题,同时,借助L2正则以及数据增广技术避免过拟合问题。实验结果表明,该方法在检测精确度以及模型大小、计算量、检测速度等多方面取得了良好的平衡,且为基网络的构造提供了新的思路。
其他文献
阵列方向图综合是阵列信号处理中的一项关键技术,广泛应用于无线通信、雷达、音频、地震勘探和医疗诊断等领域,并在近几十年中一直是阵列信号处理领域的研究热点之一。加权最小二乘方法是阵列方向图综合中的一类重要方法,该方法的核心问题是如何调节加权最小二乘代价函数中的加权系数。现有的加权最小二乘方法基于自适应阵原理,将加权系数看作“虚拟干扰”,通过调节“虚拟干扰”的强度对阵列的主瓣和旁瓣进行阵列响应控制。该方
学位
本文通过对南京大学苏州校区规划与设计过程的思考和总结,探讨了延续式设计思维在校园规划中的实践方式。首先,通过中西语境下校园规划模式的对比,反思我国大学概念的由来;其次,在回顾近代以来高等教育机构发展脉络的基础上,以南京大学鼓楼校区(金陵大学旧址)的校园空间结构演化为研究对象,梳理以教会大学为基础的历史性校园规划结构的成因与演变;最后,通过设计方案对历史文脉的思考,对场地回应方式的推敲,以及对未来教
期刊
随着深度学习技术的蓬勃发展,目标识别技术在民用和军事领域中发挥着越来越关键的作用。本文主要研究无人机载热红外图像中行人及车辆识别方法,主要工作反映如下:(1)无人机载热红外图像行人及车辆数据集构建。通常为了训练一个深度神经网络模型,需要大量的数据样本。然而,目前极少有公开可用的针对无人机视角下行人及车辆的热红外数据集。因此,本文采用大疆无人机DJIM600 PRO搭载FLIR热红外相机Vue Pr
学位
使用光气为原料进行酰基化反应是工业上合成氯甲酸酯的重要方法之一。氯甲酸酯类化合物是用于农药合成的重要中间体。光气和1-辛硫醇为原料可以合成氯甲酸辛硫酯,该反应较为缓慢,在已知的方法中往往需要使用与光气当量的叔胺作为缚酸剂和溶剂以促进反应的进行。采用催化量的三乙胺作为催化剂,采用无溶剂的方法合成了氯甲酸辛硫酯,得到了一种特别适用于大规模工业化生产的氯甲酸辛硫酯合成方法,并探讨了三乙胺催化氯甲酸辛硫酯
期刊
空间技术发展对完成复杂任务的需求日益增加,如抓捕或转移空间碎片和废弃卫星、维修或更换有故障的在轨航天器、通过加注燃料延长卫星的寿命等,这些任务要求追踪/任务航天器近距离精确估计空间目标的相对位置和姿态。空间目标常可分为合作目标和非合作目标两类,依赖于明显的合作标识或星间链路等辅助进行位姿测量,合作目标的相对位姿估计技术已趋于完善且已多次成功进行在轨验证。相比于合作目标,非合作目标没有安装通讯应答机
学位
胰高血糖素样肽1受体(GLP-1R)激动剂具有出色的降血糖作用,虽然已有多个肽类GLP-1R激动剂被批准用于治疗II型糖尿病和/或肥胖,但是以GLP-1R为靶点的新型降糖药仍是研发热点。本文将对已上市的5种肽类GLP-1R激动剂的非临床生殖和发育毒性特征进行概述。【艾塞那肽】大鼠I段:未见对生育力的损害。大鼠和家兔II段:在临床暴露水平(Clinicalexposurelevel,CEL)母体均出
会议
视频合成孔径雷达(简称,视频SAR)由常规SAR发展而来,继承了常规SAR的优势,同时具备对目标场景进行快速连续成像的能力。运动目标检测一直是视频SAR领域的研究热点之一,但是视频SAR的传统运动目标检测算法对帧间SAR图像配准要求极高,而使得检测性能下降。近年来,基于深度学习的目标检测算法因其优秀的检测能力而备受关注,随着深度学习的不断推广,越来越多的领域开始与深度学习相结合。不少学者已经将深度
学位
<正>糖尿病(diabetes mellitus, DM)是最常见的慢性疾病之一,我国是世界上糖尿病患者最多的国家,成人糖尿病患病率已高达11.9%,其中2型糖尿病(type 2 diabetes mellitus, T2DM)约占90%,肥胖和超重人群糖尿病患病率显著增加。T2DM是由胰岛β细胞功能衰退、胰岛素作用缺陷以及胰高血糖素分泌异常等共同作用所导致。胰高血糖素样肽-1受体激动剂(gluc
期刊
目的探讨超重或肥胖早期2型糖尿病(T2DM)患者的优选序贯治疗方案。方法选取2018年10月至2020年10月在广东省中西医结合医院门诊或住院的90例早期超重或肥胖T2DM患者,采用随机数字表法分为对照组、达格列净组和序贯治疗组,每组30例。对照组予以二甲双胍0.5 g/片,2片/次,口服,2次/d;达格列净组予以达格列净10 mg,口服,1次/d;序贯治疗组予以聚乙二醇洛塞那肽0.2 mg,皮下
期刊
深空探测是继卫星应用技术和载人航天技术之后的又一个航天技术发展领域。随着全球各个国家和地区在航天事业上的发展和竞争,深空探测已成为现在以及未来研究的热点之一。为了保证深空探测活动的顺利进行,确保航天器之间、航天器与地面站以及空间站之间的正常通信显得至关重要。目前PSK、PAM以及QAM等线性调制方式仍然是深空通信研究的主流,伴随着现阶段深空探测的深入发展以及探测任务的增多,线性调制方式逐渐无法满足
学位