基于深度学习的复杂场景中行人检测研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:tianxiaowei2030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉研究中的重点和难点,行人检测在学术界和工业界受到了广泛的关注。行人检测要解决的问题是计算机要在图片或视频中用算法把所有行人的位置都检测出来,并且在图片或视频上用矩形框标注。行人检测技术有着很高的实用价值,可以应用到无人驾驶、智能机器人、人体行为分析和智能交通等领域。由于现实中的行人具有相当的柔韧性,因此外观差异会很大,对行人的特征提取会有一定的难度。在行人检测过程中,行人的遮挡和行人所处的环境比较复杂,也会影响最终的检测结果。本文所采样的方法是基于Faster R-CNN算法上改进的。本文将在以下几个方面对Faster R-CNN算法进行改进。第一,Faster R-CNN网络只有一个检测网络,因此一个检测网络很容易出现输入给检测器的候选框自身的IOU阈值与检测器在训练时候给定的IOU阈值不匹配的现象,从而导致了检测效果不佳和准确率下降。因此,文本采用了级联多个检测网络的方法来提高检测精度。第二,VGG16网络层数不够深和不能解决梯度消失的问题。然而Res Net50可以用残差网络来解决梯度消失的问题以及可以加深卷积神经网络的层数。因此将Faster R-CNN的特征提取网络VGG16换成Res Net50。第三,在Caltech行人数据集中有许多小行人的数据集,这样就很容易因为网络层数太深导致小行人的特征信息丢失,导致小行人的特征无法被学习到。FPN网络可以融合高层特征和底层特征,其中底层特征一般都含有小行人的特征,使得小行人的特征信息可以保留。因此选择搭配FPN网络来提高对小行人的检测能力。第四,由于行人具有相当的柔性,导致了行人的几何变化非常的多,但是Faster R-CNN网络并没有很强的几何形变适应能力。为了解决这个问题,本文将在第四章详细描述可变形卷积网络模型,并利用该模型来提高对形变目标对象的学习能力。仿真实验是在Caltech行人数据中进行验证。经过对比实验结果表明,级联R-CNN网络+FPN网络+Res Net50+可变形卷积网络V2,相比于Faster R-CNN+VGG16和级联R-CNN网络+FPN网络+Res Net50,在召回率、准确率和平均精确度上都得到了显著的提升。
其他文献
为研究无腹筋钢筋混凝土梁的受剪力学性能,探究T形梁翼缘部分对梁构件抗剪承载能力的影响,本文围绕着无腹筋钢筋混凝土梁开展了试验研究、分析计算和数值模拟等三方面的工作。为研究不同参数对无腹筋钢筋混凝土梁抗剪承载力的影响,探究T形截面梁的受剪力学性能,考虑剪跨比(a/d)、纵筋配筋率(ρ)和梁截面形状等试验参数,设计了三组36根无腹筋钢筋混凝土梁(27根T形梁和9根矩形截面梁),进行了的单调加载试验。试
自我是个体对自身存在状态的认知,对个体的行为方式和心理产生重要的影响。家庭是我们个人成长和身心发展的重要场所之一,自我发展和家庭关系非常密切。大学阶段是个体心理获得自主感的重要时期,大学生的独立自我迅速发展,但同时,传统的家庭自我也存在。两种不同的自我,会产生一定的冲突。且在家庭情境下,多以亲子冲突的形式表现出来。亲子冲突应对方式是从冲突爆发到冲突解决必不可少的程序之一,包含合作、竞争等方式。个体
我国是白酒生产与消费大国,随着生活水平的不断提高,人们日益关注白酒的安全性。研究发现,白酒生产中产生的氨基甲酸乙酯(Ethyl Carbamate,简称EC)具有致癌性,国际癌症研究机
随着互联网的发展和智能终端的普及,大众选择和观看视频的习惯已经发生变化。全国电视观众规模、收视率不容乐观,观众总量呈下降趋势,与此同时,湖南卫视领衔的电视媒体收紧版权后,各大视频网站逐渐加强内容自治的战略模式,由此基于网络传播的综艺节目应运而生,卫视竞争演变成综艺节目的竞争。同时根据《2019年网络视频预测》可分析得出视频观看增长量正逐年递增,受众需求量增大,因此网络综艺节目主持人数量呈增长趋势。
卤键是由中性或带负电的路易斯碱与路易斯酸中的卤原子形成的非共价相互作用。随着卤键在纳米材料和生物科学中的广泛应用,卤键复合物的结构和性质成为许多科研人员关注的焦点。本文应用从头计算和分子形貌理论,从二聚体分子的结合能、表面积、体积、特征轮廓值、电荷转移量以及卤键的单电子作用势势垒Dpb的角度探究卤键复合物的结构和性质,探究的具体内容如下:(1)在MP2/aug-cc-p VDZ理论水平下计算了18
蛋白质作为生命细胞中主要功能大分子,通常与其他蛋白质合作形成交互作用。这种交互在细胞中的代谢、转录和DNA复制等几乎所有生物功能中都发挥着相当重要的作用。因此对蛋白
美国桂冠诗人丽塔·达夫(Rita Dove,1952-)是美国当代重要的非裔女诗人之一,至今已发表九部诗集,其《托马斯与比尤拉》曾于1987年获得普利策诗歌奖。作为20世纪80年代登上美国诗坛的“后黑人艺术运动”非裔诗人,达夫在美国非裔文学和美国文学史上都具有极为重要的地位,并获得了白人主导的出版界和非裔美国人文学界的关注。达夫的诗歌充满了对个人价值的关怀,对国家的认可,以及对文化身份的认同,反映
根据相关的医学研究报告,近年来心肺系统疾病越来越成为影响大众身体健康的主要因素之一。心肺音听诊作为一方便快捷且非侵入式的诊断方法,被广泛的使用在心肺系统疾病的诊断中。但在听诊过程中,采集到的心肺音除了会携带各种周围环境的噪声,心音和肺音通常在时频域混叠在一起,因此研究一种可以从混合心肺音中分离出干净的心音、肺音的方法将有助于医生进行更清晰的听诊,作出更准确的诊断。相对于传统人为设计的浅层模型方法,
随着我国设施农业的大力发展,建成面积已处于世界前列,其中连栋温室占比逐年增加,但温室配套监测决策系统却与发达国家存在较大差距,温室生产过程中产生大量监测数据无法高效
新世纪以来,人类社会生产力的极大提高,对自然界的生态环境造成了破坏,对人类的可持续发展有着巨大影响。作为哲学层面对生态问题的反思,对于生态研究的哲学就问世了。首先,