基于多标签预测与特征增强的目标检测方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:owenming521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的基础研究方向,其主要目的是区分与定位目标,广泛应用于自动驾驶,视频监控,机器人视觉等。随着深度学习的发展,目标检测的性能大幅度提升,但目标误分类问题仍是巨大的挑战。据分析,其主要来源于三个方面:其一,类别分布不平衡,数据采集于实际场景,由于类别出现的概率各异,数据集往往会出现长尾分布,而不平衡的分布及部分类别样本的稀缺使模型无法学习到充分的特征表达,影响模型性能;其二,类别间具有相似性,如桌椅等家具类别,通常有着相似的局部纹理,直接使用其相关特征可能无法有效区分;其三,模型的学习能力不足,如损失函数设计不合理、特征提取不充分、网络层级过深等。围绕这些问题,本文的研究工作主要分为以下两个方面:1)深入剖析目标误分类问题对检测性能的影响,本文在目标层面及图像层面分别对比,试图捕获图像与目标的联系,借助图像的多分类预测结果以消除未出现的类别目标。此外,为了缓解类别间相似性造成的影响,本文提出预测分布损失函数,通过在根本上增强模型的预测置信度以获取更具辨别力的特征。同时,为进一步发挥图像的引导作用,本文设计了基于图像的类别分布损失重加权方法,在图像层面计算各类别占比以平衡损失贡献。实验结果表明,在MS COCO2017与Visdrone2018数据集中,该方法大幅度降低了误分类目标的占比,在图像层面与目标层面分别达近10%/6%与5%/0.3%,模型的性能也有至少1.1%/1.5%的提升,且未给推理阶段的速度增加负担。2)针对目标特征表征力不足的问题,本文分别从网络特征提取及目标候选框的特征增强两个部分展开研究。本文提出了差异特征金字塔,以增强相邻层级间的差异性表达,使其检测范围内的特征更为凸显。此外,本文使用多尺度自适应候选框的特征融合方法,重新整合多尺度特征,从而获取更丰富的特征表征。实验结果表明,该方法在MS COCO 2017数据集中,模型性能在通用的目标检测器中至少有1.7%AP的提升,且速度上的降低是可容忍的。
其他文献
组合优化是最优化中与算法理论、运筹学相关的一个分支,在人工智能、软件工程、理论计算机科学等领域都有重要的应用。在结构化组合优化问题中,背景数据不是由单一的数据类型构成,而是由存在相互依赖关系的多个数据模块组成。不同问题样例的背景数据维度差异较大,难以用固定规模的机器学习模型处理。尽管已有研究人员尝试借助机器学习方法解析组合优化问题信息模块间的相互依赖关系,但现有的基于学习的组合优化算法仍然缺乏合适
学位
问题生成是自然语言处理的一个热门研究话题,有着丰富的应用场景,可以促进教育、对话系统、阅读理解等领域的研究与发展。最近几年,问题生成领域快速发展,研究学者提出许多方法来生成各式各样的问题。然而,在视觉问题生成领域,目前大部分研究仅仅基于图像来生成问题,而忽略了问题的难度。问题的难度在评估生成问题的质量中扮演着十分重要的角色。为了吸引用户,一个优秀的自动问题生成器应根据用户的能力和经验生成不同难度的
学位
随着信息技术与通讯技术的蓬勃发展,视频作为一种新兴的信息载体越来越受到人民群众的重视。由于成像设备与运输条件的不足,显示端的视频往往存在着分辨率低、质量差的缺陷。因此,能从低分辨率视频序列帧中恢复高分辨率视频帧的视频超分辨率(Video Super Resolution)成为了近几年的一个蓬勃发展的研究主题。而从视频超分辨率的普遍的两种不同评价指标(即重建精度和视觉感知)的角度出发,视频超分辨率可
学位
现如今,在这个集体安全意识觉醒的社会中,针对人员个体的视频监控系统拥有庞大的需求量。随着智能新科技的蓬勃发展,人工智能因其高效的设计方式、灵活的运用手段等优势,使得广大研究人员集中精力探索其中的奥秘。作为人工智能领域的一个重要分支,计算机视觉被广泛应用于智能安防监控场景中。在大型公众场所的安防监控系统中,会出现重点行人隐匿在人群中或是消失在监控画面中的情况,此时通过肉眼往往难以快速准确的在海量视频
学位
近年来,我国民用机场各类突发事件频发,机场应急管理人员作为应急救援的主导核心,其胜任力会对应急救援的成效产生重要影响。为全面提升机场应急救援效率及管理能力,必须对机场应急管理人员胜任力评价模型进行系统的研究。首先,通过对机场应急管理人员的概念和工作概述、胜任力内涵及特征模型的理论研究,对本文所研究的民用机场应急管理人员胜任力的内涵进行界定。其次,运用文本分析、问卷调查等方法,基于胜任力理论和特定的
学位
广域信息管理系统(System Wide Information Management,SWIM)作为航空信息共享平台,采用面向服务的结构实现空中交通管理(Air Traffic Management,ATM)业务数据的传输和共享。为了保护SWIM共享数据的安全和隐私,本文研究了一种基于区块链的SWIM共享数据跨域认证方法。主要研究内容包括:第一,从功能角度介绍了SWIM系统的概念架构,并逐层研究
学位
近年来,作为我国货运领域的重点发展对象,冷链物流行业发展势头强劲,在我国建设社会主义现代化的伟大征程中做出了杰出贡献。为了规避单一运输方式的缺陷,最大限度的提高运输效率,当前的货物运输通常使用两种及以上运输方式进行结合运输。随着航空运输在经济社会发展中的地位越来越重要,冷链货物空陆联运成为冷链运输的主要方式之一。多式联运作为不同运输方式相结合的运输系统,在实际工作中因操作、管理等方面存在差异而极易
学位
飞行员作为民航事故中危险的直接面临者,其能力水平将直接影响飞行安全。因此,构建可靠的飞行员能力测评方法,在保障飞行安全的过程中起到至关重要的作用。飞行员在驾驶过程中的操作水平和安全绩效受多种能力影响,已有研究证实,在由人为失误导致的飞行事故(征候)中,绝大多数涉及空间感知、信息处理、合作交流等因素。故本研究聚焦于非技术性能力维度,探究与飞行员能力水平相关的测评指标及方法,并以此为基础开发飞行员能力
学位
本文通过对锂离子电池热失控过程的产热情况进行建模仿真,定量分析了热失控过程中锂电池自身产热和热解气体燃烧对锂电池热失控传递的影响,为锂离子电池航空运输安全性分析提供理论基础。以100%荷电状态的18650型锂离子电池为研究对象,首先基于火焰高度估算热解气体燃烧热释放速率,建立了受限空间内锂离子电池热解气体燃烧的产热模型,模拟受限空间内热解气体燃烧导致的环境温度变化并进行验证。其次以阿伦尼乌斯公式为
学位
强化学习以其优秀的序列决策能力,吸引了众多研究人员的关注。近年来,结合了深度学习技术的深度强化学习在众多领域都取得了突破性的进展。然而,深度强化学习算法常常因为采样复杂度过高的问题,无法广泛应用在现实环境的任务中。模型化强化学习通过构建环境模型,能提高样本利用率,有效降低采样复杂度。但是构建环境模型存在的误差会影响到策略的优化,最终影响算法性能。基于不确定性探索的方法利用环境的不确定性信息指导策略
学位