改进的YOLO行人检测算法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:lijie041132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,行人检测技术在智能监控、智能驾驶和智能机器人等领域都有着十分广泛的应用。行人检测技术是指通过算法在指定的图像中定位到行人目标并框选出具体的位置与范围,为后续工作的开展起到前置预处理作用的技术。然而,图片与视频中的行人目标因拍摄角度不同、行人姿态各异以及存在一定的遮挡,导致YOLOv3算法对于这类目标的特征提取能力不足;同时YOLOv3算法对行人目标的特征信息融合不充分,这些问题都给行人检测带来了一定难度。针对上述问题,提出了改进的YOLOv3算法,提高了行人检测的准确性。主要的研究工作包括:(1)针对YOLOv3特征提取网络提取能力不足,使得部分行人目标出现漏检现象的问题,提出了改进的ECA-Res2Net-YOLO模型。首先,使用分层残差结构Res2Net来代替原始YOLOv3特征提取网络的DBL结构。在降低了模型复杂度的同时,增强了多尺度的特征提取能力。其次,引入高效通道注意力机制ECA来捕获相邻通道特征的依赖关系,增强网络对于行人目标的关注程度。最后,我们在Res2Net模块中的1×1卷积后嵌入高效通道注意力ECA,对经过分组与通道拼接后的特征进行重新关联。ECA模块对Res2Net提取后的特征进行了重新的通道权重加权,以此来着重关注有用的行人特征并抑制无用特征。同时,基于此模块改进了YOLOv3的特征提取网络。通过在VOC行人数据集与扩充的KITTI数据集上的实验结果表明,ECA-Res2Net-YOLO在召回率与平均精度方面都高于其他行人检测算法,召回率分别为87.6%与69.6%,平均精度分别为85.5%与70.9%。同时在模型计算复杂度与模型参数量方面相较于原始YOLOv3都有较为明显的下降,检测速度达到27 FPS。在保持检测精度的同时,兼具模型实时性的要求。(2)针对多次下采样与卷积可能导致小目标特征信息丢失,YOLOv3特征融合网络特征融合不充分等问题,提出了一种改进的YOLOv3特征融合网络。首先提出了一种改进的空间金字塔池化结构DSPP模块,该模块借鉴了空间金字塔池化与密集连接的思想,在最大池化层后接入1×1卷积来对提取的特征进行整合;同时拥有大池化核的池化层的输入不仅包含原始输入,还包含了小池化核的池化层经过1×1卷积整合后的输出。经过改进的空间金字塔池化结构DSPP模块,增强了特征的表达能力,有效地解决深层网络出现的特征丢失问题。其次,借鉴Bi FPN思想来改进YOLOv3特征融合网络。在FPN结构的基础上构造了双向的特征融合通道,对于提取到的浅层与深层特征进行充分融合;同时对于多次使用到的F4层特征,在F4层特征的同一层增加一条横向的跳跃连接,使网络能够重复利用提取到的F4层特征,使得获得的特征图语义更加充分。最后,在所用实验数据集上进行实验,并与其他行人检测算法进行对比。实验结果表明,改进特征融合网络的YOLOv3模型能够有效地提高行人检测的精度。
其他文献
目的:通过探究OLFML2A对胶质瘤细胞侵袭、迁移和自噬的影响,揭示OLFML2A促进胶质瘤自噬、侵袭和迁移的分子机制。筛选并鉴定特异性互作的蛋白,明确两者相互作用的生物学功能及对GBM的影响。方法:1.通过TCGA和GTEx患者信息数据库,分析OLFML2A在胶质瘤患者中的表达。收集胶质瘤患者临床标本,分析OLFML2A的表达差异与胶质瘤患者预后的关系。2.以U251、U87-MG为研究对象,使
学位
图像作为人类获取信息的重要方式,在日常的信息流通中发挥着不可替代的作用。图像的超分辨率技术就是使用各种数字图像处理技术,以低分辨率图像作为基础,重建出与低分辨率图像具有相互映射关系的高分辨率的图像。传统的图像超分辨率算法一般从频域或者空域的方向来对图像进行复原,没有考虑到图像自身的先验信息,恢复出的图像会存在各种问题,且传统方法对使用条件有着严格的要求,因此具有一定的局限性。近些年来,随着机器学习
学位
目的:基于内腔镜手术监测仪比较经尿道等离子前列腺电切术(Transurethral plasmakinetic resection of the prostate,TUPKRP)与经尿道等离子前列腺剜除术(Transurethral plasmakinetic enucleation of the prostate,TUPKEP)的术中安全性。对象和方法:在这项前瞻性,单中心,非随机同期对照真实世
学位
迄今为止,我国已经完成建设的5G基站142.5万个,2022年即将超过200万个。随着人们对无线通信系统传输速度的要求越来越高,对网络容量和服务质量的要求也越来越高。在热点区域内,宏基站很难满足需要,也难以提高良好的覆盖。认知异构网络既能够对宏小区内部进行异构扩容和补充覆盖,又能够在授权频段为智能终端提供频谱接入和频谱共享等功能,不论是D2D(Device-to-device)、V2V(Vehic
学位
背景:研究表明肿瘤免疫微环境(The tumor immune microenvironment,TIME)中免疫细胞浸润和肿瘤的发生发展以及预后有一定的关系,同时,RNA N6-腺苷甲基化(N6-methyladenosine,m6A)与肿瘤生物学行为也有一定的联系。然而,在肾透明细胞癌(clear cell renal cell carcinoma,cc RCC)中,m6A与肿瘤免疫细胞浸润的
学位
铝材作为一种常用工业材料,市场需求大,品质要求高。但是铝材在生产过程中由于多种原因,导致铝材表面不可避免产生缺陷,降低产品外在美观度,影响产品的使用性能,缩短产品使用寿命,因此铝材表面缺陷检测至关重要。表面缺陷检测方法多样,过去常使用人工目检,检测灵活,但是主观性强,检测速度慢。随着计算机视觉技术的快速发展,基于深度学习的检测方法在多个领域取得了广泛应用,检测效果突出。因此,本文以经典的深度学习检
学位
目的:为了解兰州地区目标人群前列腺癌(prostate cancer,PCa)的发病率,并分析除前列腺癌、前列腺炎等因素外,其他可能对总前列腺特异性抗原(total prostate specific antigen,TPSA)检测值造成影响的因素。方法:于2020年12月10日至2021年5月29日期间,在甘肃省兰州市城关区14个社区卫生服务中心和6家医院(以下简称“社区”)随机招募40岁以上不
学位
目的:探讨鹰嘴豆芽素A(Biochanin A,BCA)对胶质母细胞瘤的抗肿瘤作用和对细胞能量代谢的影响,并揭示其中的分子机制。方法:1.选取了U251和U87细胞,用不同浓度的BCA进行不同时间处理,用CCK-8、Edu、细胞克隆和流式细胞术等验证增殖、凋亡情况;蛋白免疫印迹检测线粒体凋亡相关蛋白Max、Bcl-2的表达;HE染色观察给药BCA后裸鼠皮下移植瘤病理学改变,免疫组化分析Ki-67的
学位
红外与可见光图像融合是图像融合领域中的一个骨干分支,在场景监视、驾驶辅助、公共安防、生物识别等诸多领域中被广泛应用。红外传感器和可见光传感器是日常生活中最常见以及应用最普遍的传感器,由于两者的成像原理不同,获取的图像也表现出各自不同的特性。红外传感器识别目标是根据目标与场景间的热辐射信息量大小不同进行信息获取,具有较强的抗干扰能力和可以24小时不间断工作的优点,但其获取的图像存在可视性差、清晰度低
学位
目的:感染性骨缺损及慢性骨髓炎是骨科较为常见疾病之一,临床治疗难度加大,往往耗费大量人力、物力及财力,仍存在治愈困难的情况,给患者的生活及工作造成极大影响。SF/VANCO/PLGA/β-TCP复合抗感染人工骨支架是治疗感染性骨缺损的可选方案,具有良好的应用前景。本研究通过构建复合抗感染人工骨支架,并探索复合支架的体外生物学评价,以期为临床慢性骨髓炎的治疗提供一种新的可替代治疗方案。方法:本实验由
学位