基于神经网络的多尺度目标检测方法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:luozd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于神经网络的深度学习技术取得的进步使得在许多视觉任务上,计算机的表现已经超过了人类,计算机视觉也因此逐渐成为了热门研究方向。而作为一种基础任务的目标检测,也自然而然受到了极大的关注。在一幅图像中,存在着不同尺度的目标,大尺度的目标细节清晰,占据的像素多,小尺度的目标细节模糊,占据的像素少。现有的目标检测方法在图像中同时出现多种尺度的目标时,难以做出适当的处理。相比于只存在单一尺度目标的图像,存在多尺度目标的图像更难以被精确检测。本文针对基于神经网络的多尺度目标检测方法进行研究,并提出了相关的改进方法。目标多尺度对目标检测任务造成的限制主要包括两点:1.不同尺度目标分布不均衡影响样本分配;2.难以同时生成适合描述多尺度目标的图像特征;本文针对这两点限制,提出了对应的解决方法。针对样本分配中的问题,本文提出了尺度均衡损失。在多尺度目标检测中,锚点框这一概念被大量使用,它被用于和真实目标进行匹配,作为网络的训练样本。遗憾的是这样的匹配策略将导致不同目标的匹配数量差异,将直接使得小尺度目标检测精度下降。针对此问题,本文提出一种用于缓解锚点框匹配过程不平衡的损失函数:尺度均衡损失。它将从损失函数层面,通过平衡锚点框匹配过程产生的信息量差异,使得模型整体的优化方向朝向更平衡的状态。在多个学术界常用多尺度目标检测数据集上,尺度均衡损失都能显著提升多尺度目标检测精度,尤其针对小目标召回率有大幅度的提升,这对于某些对小目标敏感的任务如视觉辅助自动驾驶是非常有意义的。针对多尺度特征问题,本文提出了一种适合多尺度目标的神经架构搜索算法。对于多尺度目标,为了识别出它们而需要的图像特征是不同的。大尺度的目标需要自身更大的检测感受野,而小尺度目标不但需要自身特征信息,往往也需要结合周围语义信息才能准确识别。当前的目标检测特征提取网络大多都是将为分类任务设计的网络直接迁移,而鲜有针对多尺度目标检测任务做专门设计。仅仅通过特征金字塔处理多尺度特征是不够的。本文提出了一种可微采样神经架构搜索算法,设计了一种适合多尺度目标检测的搜索空间,在此搜索空间上搜索多尺度目标检测特征提取网络,在同FLOPS限制下,该方法超过现有的基于强化学习或遗传进化算法的神经架构搜索任务,在多尺度目标检测任务上实现了精度提升。
其他文献
以研发一种新型、高效、节能、环保的冷芯盒制芯材料及其在缸体铸件砂芯上应用为目标,使其满足既具有优异的工艺性,又能适合绿色、环保的铸造生产大批量制芯的需求。论文研究取得以下成果:(1)优化了酚醛树脂本体合成工艺确定最佳的工艺参数和原材料配比,得到了具有较高强度的甲阶酚醛树脂本体。采用分段升温等工艺方式,以Na OH为催化剂,由甲醛和苯酚等材料在碱性催化剂作用下通过缩合反应获得/制备。技术参数为:Na
网络热点事件反映了社会动态、民生意愿,受到社会各界广泛关注,但是新闻门户网站中存在大量冗余的信息,人工的方式难以有效获取网络热点事件相关信息,且部分网络热点事件爆发迅速、影响巨大,人们需要及时了解事件发展态势。因此人们需要计算机能够在大量的新闻信息中自动发现网络热点事件,甚至在网络事件的早期对热点事件进行识别。网络热点事件识别技术受到研究者们的广泛关注,很多研究者使用不同的文本表示模型提升了热点事
党的十九大报告提出实施以“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”为总要求的乡村振兴战略,做好脱贫攻坚与乡村振兴的过渡和衔接。本文基于资产建设研究的视角,以D村为研究对象,以乡村振兴为背景,以资产建设理论为基础,综合运用个案访谈法和实地观察法,从自然资源及物质资产、人力资源资产、产业经济资产、社区组织资产、文化资源资产5个方面着手研究D村的资产建设实践,探讨乡村振兴背景下农村资产建设的路
近年来,随着中国经济的快速发展和新兴城市的迅猛崛起,国家安全面临诸多威胁和挑战,城市安全形势十分严峻。从国内层面看,城市人口膨胀、贫富差距拉大和社会利益分化等冲突进入前所未有的活跃期;从国际层面看,恐怖袭击事件频繁发生,严重危害到社会公共安全秩序。为了解决当前城市安防监控系统存在的时效性差、检测率低和局限性大等问题,本文提出将异常声学事件检测(AAED)系统加入城市安防监控系统中,从信号的预处理、
当前信息社会的飞速发展对通信传输的容量和质量提出了更高的要求,如何保证通信系统能够更好地服务于未来数以十亿计的用户和设备正成为一个重要的议题。为了解决频谱资源日益紧缺,与通信系统性能要求不断提升之间的矛盾,人们将目光投向了频谱资源丰富并且尚未被大规模使用的毫米波波段。毫米波具有频带宽、波束窄等特点,同时其超短波长特性使天线阵列的大规模集成成为了可能,因此,毫米波技术与大规模MIMO(Multipl
创业意向(Entrepreneurial Intention)是创业初始阶段的必须要素,也是预测创业活动的重要方面。随着近期我国转型化进程渐渐加快以及社会就业压力的不断加剧,创业逐渐成为大
在过渡金属催化的反应中,膦是最为常见的一类配体,它对稳定活性金属中心原子和微调反应选择性方面都起着至关重要的作用。近些年的研究发现在过渡金属催化的反应中,膦配体的C-P键可以发生断裂,并形成一些意外的偶联产物。这个实验现象促使一些化学工作者产生了研究兴趣,并对C-P的活化和断裂进行了探索和研究。本论文的研究工作就是基于这些研究工作的基础上,通过季鏻盐中C-P键的断裂,结合不同的亲核试剂,实现了一系
针对提升ZnO材料在加速度传感器中的应用,本文基于MEMS技术设计了一种ZnO纳米结构加速度传感器,其结构由硅基悬臂梁、Ti/Pt底电极、ZnO籽晶层、ZnO纳米结构和Ag顶电极组成。基于压电效应的理论基础,利用信号发生器施加一定大小的激振电压对加速度传感器梁体进行激振,ZnO纳米结构和ZnO籽晶层组成的压电层会因梁体振动产生交流电信号,经上下电极导出以实现对输出电学信号的测量。通过COMSOL软
原核生物类泛素化修饰(Pupylation)是在原核生物中发现的与真核生物中泛素化修饰作用相似的一种蛋白质翻译后修饰形式。在该过程中,原核类泛素化蛋白PUP在酶的作用下识别出细胞中的底物蛋白质并对其特定的赖氨酸残基进行修饰。最新研究表明,原核生物类泛素化修饰与某些致病性细菌的致病性密切相关,弄清其作用机制可以为这些细菌所致疾病的治疗提供帮助。在原核生物类泛素化研究中,关键的步骤是找出PUP的底物蛋
资源枯竭型城市是我国城市体系中的重要组成部分,是我国经济建设的中坚力量。自20世纪80年代以来,随着城市的不断发展,资源储蓄量不断减少,社会矛盾日渐突出,城市经济开始衰退,使得人民生活水平不断下降。因此,资源枯竭型城市大都面临着转型的问题,而发展高新技术产业已经成为解决资源枯竭型城市问题的主要途径。高新技术产业是区域经济竞争力的体现,是区域社会发展的新的增长点,资源枯竭型城市能否增强竞争优势,快速