基于改进的多尺度特征目标检测算法

来源 :西南大学 | 被引量 : 0次 | 上传用户:kokwok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测(Object Detection)是计算机视觉的一项基本任务,在智慧医疗、自动驾驶、智能农业等领域均具备应用价值和潜力,因此从理论和应用层面,对目标检测算法进行深入研究具有重要的现实意义。本文重点研究基于深度学习的目标检测算法。通常,基于深度学习的目标检测算法根据其机理可分为二阶段目标检测算法与一阶段目标检测算法。根据现有研究,一般意义上,二阶段目标检测算法精度高、但实时性差;而一阶段目标检测算法精度低、但实时性强。因此为了兼顾实时性和准确性两项性能,本文以SSD(Single Shot Multi-Box Detector)目标检测算法为基准框架,研究如何进一步提升目标的检测精度,本文从以下三个问题的角度展开研究:1.由于在训练集中可能出现前景与背景的高度关联,造成训练数据多样性的欠缺。为缓解此问题,本文提出背景解耦数据扩增策略。该策略以训练集中已标注物体(Ground Truth)为基本对象,对其进行边界框(Bounding Box)镜像、边界框循环平移与“随意”背景扩充的操作。通过使用背景解耦数据扩增策略,使目标检测算法在训练过程中更关注如何学习目标或前景本身的几何或语义特性,隔离与前景高度关联背景的干扰,从而提升目标检测算法对物体本身特征的提取能力。2.SSD、YOLOv1、YOLOv2等一阶段目标检测算法具有较小目标检测性能偏低的缺陷,主要因缺乏特征重采样所致。为解决该问题,提升模型对较小目标的检测效果,本文提出基于多尺度注意力机制的目标检测算法。该算法重点以选择性内核网络与特征金字塔网络作为研究对象,从注意力机制和深浅层特征融合两个角度出发,提升模型对较小目标特征的感知能力。3.在一阶段目标检测算法训练过程中,由于简单样本所引起的梯度淹没,以及特别困难样本引起模型的过拟合,造成样本学习难易程度不一致。为减缓此问题,本文引入梯度均衡机制,及通过在一阶段目标检测算法的代价函数中引入梯度均衡机制,降低特别困难样本与过多数量的简单样本对模型训练过程所造成的影响,增强模型泛化能力与鲁棒性。本文在PASCAL VOC数据集上对所提出的策略与算法进行了评估。实验结果显示,从精度方面看,在相同训练环境和超参数设置下,背景解耦数据扩增策略使SSD目标检测算(基准框架)法在PASCAL VOC 2007测试集上的平均精度从74.30提升到82.65,基于多尺度注意力机制的目标检测算法在此基础上将精度提升到84.84,而梯度均衡机制的引入进一步将平均精度提升到85.35。在实时性方面,由于背景解耦数据扩增策略和梯度均衡机制并不影响实际模型结构,所以并未增加延时,基于多尺度注意力机制的目标检测算法由于引入选择性内核网络与特征金字塔网络,相比SSD网络架构,其模型检测速度从93FPS(2080Ti),延长到89FPS(2080Ti),并未显著影响算法的实时性。
其他文献
2013年教育部开始实施对普通高中课程的修改工作,2017年发布了修订之后的各学科课程标准。各学科的课程标准中都强调了要落实学科核心素养,要在全面贯彻党的教育方针和发展素质教育以及落实立德树人根本任务方面,充分发挥各学科的作用。在新的高中化学课程标准发布之后,笔者参加了所在市区教研员主持的“高中化学核心素养解读”的培训。通过培训学习,笔者认识到化学核心素养的培育和养成,关键在于如何将这些素养和理念
随着Internet的迅速发展,网络中的文本信息也在持续增加。文本信息作为最常见的表达形式,自然成为研究热点。而文本分类则是自然语言处理中的一项重要任务,它可以有效地识别和整合信息并实现自动分类。文本分类技术作为数据挖掘的基础技术,已广泛应用于信息检索,信息管理,语义理解等领域,并取得了良好的效果。而医疗领域作为文本分类的特定领域,由于医疗文本中可能包含较多复杂且专业的医学词汇,使得数据稀疏和维度
火灾是现代社会中最经常发生的人为灾害,严重威胁着人类生命财产安全。物流仓库和工厂等火灾高危场所具有占地面积超大,建筑结构复杂,运行设备较多,安全风险较高和存放大量易燃物品等特点,早期燃烧的火灾不容易发现,而处于成长期的火灾扑灭难度较大,一旦仓库和工厂发生火灾就会造成重大人员伤亡和财产损失,所以对火灾防控重点场所进行火灾预警就特别重要。传统的火灾检测主要靠安装在固定位置的火灾探测器和视频监控来完成,
随着时代与科技的发展,社会也进入了信息化社会,技术的发展为人们的生活带来了翻天覆地的变化,同样随之变化的是社会对人才的需求,意味着学校的培养要随着社会的进步而进步。我国教委会为了能让学校培养的人才与社会的需求接轨,提出了21世纪学生技能框架和学科核心素养。传统的教学方式已经不能满足日益进步的社会,而信息技术是21世纪人才必不可少的技能,所以信息技术的教学改革也被提上了日程,受到了关注。2018年,
高中通用技术课程是一门以设计学习和操作学习为主要特征,具有立足实践、注重创造、体现科技和人文相统一的特点的课程,是培养学生适应高等教育、职业发展和社会生活所必需技术的课程。四川省通用技术课程开设于2011年,笔者使用问卷调查法调查四川省通用技术课程教学现状,问卷回收后经数据分析发现:四川省通用技术课程教学中存在教师专业不对口、专职教师数量不多、专用教室利用率较低、教学理论性偏重的问题。教育部201
中国的高考录取机制作为国家人才选拔的重要机制之一,一直是社会各界广泛关注的热点话题。内蒙古推行的实时动态志愿机制由于填报信息完全,可促进录取结果的公平与效率,一直被众多学者认为是未来高考改革的新方向。在实时动态志愿机制下,若每个考生都能真实填报志愿,该机制可达成完全信息博弈下的唯一均衡结果。但在现实情况中,部分考生为了获取更多效益,在志愿填报过程中他们将找寻同伴达成合作并占位,即高分考生先在低分考
近年来互联网技术,人工智能技术的飞速发展,让人们意识到信息技术是推动全人类科技进步,经济发展的重要力量。而在这个新时代中,学生对信息技术知识的要求和接收方式也在逐渐发生改变,传统的教学模式无法满足现阶段的需求。为了满足现阶段高中信息技术教学的需求,本文将信息技术教学理论与近年来的新型课堂教学模式结合,采用理论研究法、文献分析法、问卷调查法、数据分析法等方法,对“5+1”课堂教学模式在高中信息技术教
在如今这个大数据时代,信息技术的发展日新月异。在新课改的导向下,初中学生的全面发展离不开信息技术知识的支撑。传统的老师主讲、学生被动接受的授课模式已经无法适应时代的变化,限制了学生获取知识的渠道和发展空间,无法培养出有自主学习能力的创新型人才,教师需要研究新的教学方式去培育学生的核心素养。本文是要研究基于项目的学习对初中生的信息素养能力有何作用。笔者首先分析了国内外文献和相关理论的研究基础。结合多
随着人工智能、互联网技术的应用,网络教育实现飞跃发展。目前,网络教育考试系统中对于选择题、填空题等客观问题可以做到准确的自动评分,但是对于主观题的评分仍然只能由教师进行人工评分。随着网络教育考试的规模不断扩大,教师阅卷负担越来越重,这不利于网络教育教学的发展。因此,研究主观题自动评分的相关技术具有十分重要的意义。文本相似度计算是主观题自动评分中的关键技术,本文对几种适合于主观题自动评分的相似度算法
近年来,信息学奥林匹克竞赛在各大中学不断地发展与推广,评测系统作为信息学竞赛中不可或缺的辅助工具,不仅能减少教师的工作量,还能给学生提供及时且准确的反馈。目前信息学竞赛课程中使用的评测系统有两种,一种是网络上的开放式在线评测系统,也是目前使用最多的一种方式;另一种是本地搭建的校园在线评测系统。其中开放式评测系统虽然使用方便,但是其题库资源有限、不具备可再开发性且不方便管理学生,影响了教师对学生学习