【摘 要】
:
目标检测是计算机视觉领域的核心分支,主要任务是在给定的输入图像中找到感兴趣的目标,并确定它们的大小和位置。目标检测在实际应用中常常会受到目标的形状、姿态、大小、光
论文部分内容阅读
目标检测是计算机视觉领域的核心分支,主要任务是在给定的输入图像中找到感兴趣的目标,并确定它们的大小和位置。目标检测在实际应用中常常会受到目标的形状、姿态、大小、光照环境、遮挡等众多因素的干扰。传统目标检测算法需要繁复的特征提取步骤,而卷积神经网络却能实现特征的自主组合提取,并在图像分类、识别、检测等领域实现了巨大飞跃。本文的研究内容是研究基于卷积神经网络的道路目标检测算法,论文概要如下:(1)提出了基于特征融合的Faster-RCNN目标检测方法。本文在Faster-RCNN检测算法基础上,对提特征的基网络进行部分反卷积操作,实现目标区域全局与局部特征的融合,使得模型特征的表现、泛化能力得到进一步提高。并对实验使用的KITTI数据集按照目标遮挡、截断程度,划分成简单、较难、困难三个类别进行测试,最后通过实验证明:改进后的算法对机动车、行人和自行车等目标检测性能达到了1到4个百分点的提高,达到了更好的检测效果。(2)深度学习任务一般会选择Batch Normalization作为数据归一化方法,Batch Size的大小一般设置成32或64。而目标检测由于较大的运算量,常规的Batch Size会超出一般计算机的运算负荷,而选择较小的Batch Size却又会使性能降低。本文采用的Group Normalization归一化方法,能保证在较低的Batch Size情况下不会对检测性能产生较大影响,数据增强部分使用了图像混合方法,最后在KITTI数据集上进行效果测试。结果表明:本文采用的Group Normalization归一化和图像混合数据增强方法,对行人检测准确率的提高有一定的效果。本文提出的改进算法在KITTI公开数据集上进行了一系列的实验验证,证明本文算法对目标检测效果有一定的提高。
其他文献
随着近几年海洋资源的深入开发,水面无人艇因为其优秀的运动特性而被广泛研究应用。针对水面无人艇广阔的市场前景,国内外学者在其运动特性、艇型优良设计,以及水动力优化等
目前对热水沉积区优质烃源岩的研究以及热水沉积与优质烃源岩成因机理关系研究,还相对比较薄弱。对热水沉积与优质烃源岩的相关性与成因机理的研究,不仅属于一项基础研究,而且对于油气的勘探开发均具有重要的理论和实际意义。本研究拟以黔北地区下寒武统牛蹄塘组黑色页岩为重点,系统采集黔北贵州省贵阳市清镇市百花湖乡温水村,遵义市遵义县松林镇中南村,毕节市织金县桂果镇联兴村,黔东南州麻江县下司镇羊跳村,黔东南州丹寨县
正交频分复用(OFDM)是一种适用于高速无线传输的多载波调制技术。它已经被广泛的应用于多径衰落条件下,具有频谱效率高、抗多径衰落等优点。OFDM与生俱来的高峰均比问题限制了它的广泛应用。在许多文献中提出的很多的峰均比(PAPR)降低技术中,子载波预留技术已经受到了很多关注。该技术使用一些预留子载波来产生峰值减小信号以降低OFDM信号的峰均比。然而,获得优化的峰值减小信号需要解决一个二次约束的二次规
时间序列是否具有混沌特性决定着预测方法的探究及其相关性质的讨论,影响着时间序列预测的准确性,混沌辨识为时间序列的预测提供了重要的理论前提,因此,混沌辨识研究在时间序列分析上具有极其重要的地位.本文主要采用有序模式、排序熵等研究方法及混沌理论对降雨量时间序列、径流量时间序列以及交通流时间序列进行研究.首先,对降雨量时间序列和径流量时间序列以及交通流时间序列进行数据预处理.其次,引入基于有序模式的三态
随着中国物流行业的蓬勃发展,物流在不断凸显其对我国经济发展的基础性作用的同时也带来了巨大的挑战。在当前物流行业的粗放发展模式下,物流成本过高的问题已经成为物流行业
本文为《铁路桥涵混凝土结构设计规范》汉译英翻译实践报告,是作者读研期间参与的一个基于计算机辅助翻译工具的协同翻译项目,作者负责其中约16000汉字的翻译。本报告首先介绍了该翻译项目的大致情况,阐述了该项目的实际意义,分析了客户要求,并梳理了本报告的脉络结构。其次,本报告回顾了项目译前、译中与译后的过程。之后则重点解释了技术文本中专业术语的含义及特点,并阐述了专业术语翻译的原则。本文的一大创新在于:
隐藏吸引子是一种新的吸引子,与典型的Lorenz、Rossler、Chen吸引子不同,它不包含平衡点的邻域,也不能用传统的计算方法去计算这些隐藏吸引子.第一章讲述吸引子理论研究的背景和意义,并介绍隐藏吸引子的一些预备知识,如:新分析-数值算法的思想、谐波线性化和稳定周期解的定位.第二章研究一类非线性Van der Pol-Duffing振子,研究这一非线性系统的隐藏吸引子.首先,通过计算系统的特征
近年来,深度学习方法极大地提高了人脸识别的准确性,为了获得更高的识别准确率,集成学习可以应用于深度学习算法中。传统识别算法难以捕捉到面部表情所传递的有用信息,面部表情识别存在分辨率低、遮挡、光照、位置等问题,通常情况下,由于这些面部表情分类很差,人类无法识别它们。此外,面部表情的分类比较特殊,例如面部微笑并不总是意味着开心,面部表情往往取决于文化。然而,提高面部表情识别准确率可以应用到更灵敏、更智
第一部分倒退型孤独症谱系障碍儿童基于纤维束示踪的空间统计分析研究目的:利用基于纤维束示踪空间的统计分析(Tract-based spatial statistics,TBSS)技术,比较分析孤独症谱
2017年12月31日起我国开展第二次全国污染源普查。普查数据作为制定环保政策与编制环保规划的依据,数据质量至关重要。十年前,第一次污染源普查受到技术发展的限制,数据审核