基于YOLOv4改进算法的无人机下车辆检测研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:watertnt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测任务是计算机领域中的一个重要研究分支,涉及的应用领域也十分广泛,例如,医疗影像、智能交通安全等。以智能交通安全领域为例,通过在街道各个角落安装高清摄像头,实时获取街道行驶车辆的交通轨迹,以便及时提醒驾驶人遵守交通规则,避免车祸的发生。目标检测技术已成为生活实际场景中的重要工具。目前,基于深度学习的YOLO目标检测算法系列中,YOLOv4算法在单个GPU上就可完成训练,而且使目标检测的速度和精度达到了一个相对平衡的状态。其中,它在YOLOv3算法的基础上融合了近年来优化卷积网络模型的算法思想:在主干部分采用CSPDarknet-53加强特征提取,增加SPP池化层扩大感受野,引入PANet来增强特征融合等。在YOLOv4目标检测模型中,小目标的检测精度与中和大尺度的目标相比,依然存在较大差距。因此,本文将当前流行的YOLOv4多尺度的目标检测算法模型经过进一步研究,移植并应用到小尺度的目标上,从而提升小目标的检测能力,具体的研究工作主要如下:(1)为了提高小目标的定位准确性,采用K-means++代替K-means聚类算法的方法,重新对无人机下VEDAI数据集聚类分析,来获取更适合小目标数据集的锚点框。(2)为了增强小目标的特征提取性能,提出了一种基于RFBNet的改进算法模型为RFB_I。将SPP池化层替换为RFB_I感受野模块,通过RFB_I模块嵌入该网络模型中颈部的不同位置来查看增强小目标浅层特征的能力变化。(3)为了降低小目标的漏检率,提出了一种基于CBAM的YOLOv4改进算法。将全连接层使用一维卷积层代替,并将CBAM中注意力机制串行连接方式改为并行连接方式,并选择在YOLOv4特征融合网络的最后三个分支处各增加了一个CBAM模块。为了验证改进网络模型的有效性,选择从其他目标检测模型和公开数据集两个方面进行证明:一方面,将改进的网络模型与其他的目标检测模型做对比实验,通过不同模型对同一数据集VEDAI的训练预测,证明了YOLOv4的改进模型的MAP值最高;另一方面,将改进的网络模型与原YOLOv4在常用的公开数据集PASCAL VOC上训练、预测对比得出,提出改进的目标检测模型在MAP上提升了2.27%的准确率。因此,提出的目标检测模型对小目标的检测具有一定的有效性。
其他文献
外膜蛋白(Outer Membrane Protein,OMP)是跨膜蛋白的一个重要类别,对于疫苗设计、抗生素抗性以及癌症诊疗研究均有重要意义。外膜蛋白处于生物外膜特殊环境,因此,生物实验技术无法大规模解析其蛋白结构并深入探究由结构决定的生物功能。基于当前条件,采用计算手段探索克服外膜蛋白小样本问题的结构特征预测方法成为领域内研究的重要途经。拓扑结构是体现外膜蛋白家族功能的显著结构特征。拓扑结构预
学位
部分集合覆盖问题是集合覆盖问题的扩展,其目标是用尽可能少的子集覆盖至少k个集合。部分集合覆盖问题在覆盖目标或带约束的放置等问题中有着广泛的应用,并已被证明为NP难组合优化问题。随着技术的发展与进步,集合覆盖问题及其延申问题愈发得到研究者的关注,如何有效地解决这类优化问题具有重要的理论价值和现实意义。求解集合覆盖问题的方法主要分为精确算法与启发式算法。精确算法能够求出问题的最优解,但当问题规模较大时
学位
癌症是全球范围内致人死亡的重要原因之一,其特点是由基因突变导致细胞异常增殖和失控。作为一种十分复杂的异质性疾病,癌症的诊断传统上主要基于组织病理学和临床特征,因此需要人工检查和临床医生精湛的专业知识,难以统一实施。尽管这些癌症诊断结果对病人的预后价值无可争议,但是由于缺乏明确的分子基础数据,其在预测抗癌药物疗效方面的效果还存在一定的提升空间。为了可以促进患者的后续治疗和个性化管理,癌症亚型的诊断和
学位
具有超凡属性的类石墨烯结构的磁性薄膜材料,被认为是理想的半导体材料,在量子芯片领域具有十分广阔的前景。本文在海森堡模型的框架下,研究了“铁磁-反铁磁-铁磁”和“铁磁-铁磁-铁磁”这两种典型的类石墨烯薄膜。论文采用线性自旋波理论,引入推迟格林函数方法,对系统哈密顿量进行了对角化求解。基于谱定理和关联函数,对比研究了交换耦合相互作用、各向异性以及自旋量子数等因素对能隙、共振频率和基态磁矩的影响。研究发
学位
2020年初新型冠状肺炎病毒爆发,迅速蔓延并肆虐全球,疫情持续时间长,对特定人群危害程度大,引起社会各界的高度重视,在各个社交平台关于疫情话题急剧增加。了解大众舆论热点话题,分析人们对各类疫情信息的情感反馈,从而对社会舆情进行正确导向,同样是战“疫”的重要一环。然而,如何有效地对大规模的文本数据进行提取、分析、处理和决策,是舆情监测问题面临的巨大挑战。本研究提出一套面向舆情数据的主题情感演化可视分
学位
免疫信息学是在现代信息学和免疫学的基础上建立的新兴学科,它是一种使用信息学的相关方法理论来处理免疫和疫苗学相关问题的学科,同时也是研究生物免疫应答过程中信号传输规律以及免疫系统调节的学科。作为免疫信息学研究的主要问题之一,表位预测是研究疫苗、抗体、变态反应和移植免疫计算分析的基础。表位是在抗原分子中能够与抗体或受体结合、引发特异性反应,从而引发免疫应答的特殊化学结构。B细胞表位是指抗原表面上,能够
学位
随着现代科技的进步,视频和图像已经成为人们最主要的信息传递方式,如何更好地利用这些信息是一个值得深入探讨的问题。3D人体姿态估计是计算机视觉领域的一项热门研究话题,它是指从视频或图像中估计人体关节点的3D位置。3D人体姿态估计技术拥有十分广泛的应用场景,如人机交互、自动驾驶和视频监控等。但是目前该技术的发展仍然不够成熟,取得的成果距离人们满意的效果还有很大差距。本文研究的主要内容是设计一个深度网络
学位
约20%的人在其一生中都会患有癌症,其中乳腺癌的发病率逐年提高并在新发患者数量和死亡数量上都位居第一。据统计结果显示,45岁到55岁是乳腺癌病症的高发期,早期乳腺癌的治愈率可达到90%,所以越早发现越能提高乳腺癌患者的治愈率。由于传统的乳腺检测方式时间周期长、费用高,所以提高检测速度并降低费用变得越加重要,拉曼光谱作为一种分子散射光谱,能够检测到物质中分子结构和含量的变化,在疾病诊断方面具有一定的
学位
随着科技的不断发展,以物联网、云计算等技术为支撑的大规模开放在线课程正逐渐成为一种大众喜爱的学习方式。在线课程摆脱了传统课堂的时空约束,对学习者的资质限制较少,具有自由、灵活的优势,但是其也面临着管理难以规范化、辍学率高、通过率低等问题。为了提高课程的完成度,研究人员通常基于平台中学习者的历史学习行为数据,采用机器学习模型预测学习者发生辍学的可能性。机器学习模型强大的建模能力,能够实现对学习者学习
学位
人类拥有精确跟随他人视线的能力,这种追随他人视线的能力被称为凝视识别,这种能力可以让人们更好地理解他人的意图,甚至可以预测他们未来的行动。计算机一旦掌握这种能力,就能在多个领域(教育、医疗、智能监控、VR游戏或人机交互领域)为人类提供更方便、更智能的服务。近年来,随着深度学习的不断发展,凝视识别这一基础研究取得了一系列的突破,这无疑推动了计算机视觉的进步。虽然目前大多数凝视识别算法取得了令人印象深
学位