融合多实例预测的快速行人检测算法

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yipan1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测技术在生活中应用广泛,推动了安防、自动辅助驾驶和机器人等的技术迭代更新。近年来,随着设备的计算能力的提升,行人检测技术也不断有新的突破。目前效果较好的行人检测算法多是基于双阶段检测方法,但是检测效率低,在商业落地实现时也比较困难。而单阶段行人检测算法虽然检测速度较快,但大多都是基于SSD结构的,且在拥挤场景中,对高度重叠行人的检测能力较弱。本文基于单阶段检测算法,提出了一种融合多实例预测的高度重叠行人检测网络YOLOv3-MS,主要创新部分有改进的YOLOv3网络结构和多实例预测,具体工作内容为:(1)实现多尺度特征提取,将检测尺度扩展为五个,融合更多的浅层特征和深层特征,解决了特征不丰富的问题,加强了对多尺寸行人目标的检测能力。(2)优化网络结构。首先修改主干网络中Block的重复次数,其次将FPN结构中五次卷积操作改为三次卷积操作,其中普通卷积由深度可分离卷积代替,使得在增加检测尺度的情况下,网络的参数量和计算量不至于增加太多。(3)设计多实例预测模块,解决了高度重叠行人检测时因相邻同类别的预测框被错误抑制造成的漏检问题。在Crod Human数据集上的实验证明,本文方法的整体性能与目前的单阶段检测方法相比,具有一定优势,平均对数漏检率为53.72%,AP则达到了86.56%,最终精度和速度达到了一定平衡。虽然YOLOv3-MS网络的检测能力和速度都比较有优势,但是并不适用于实际应用中的设备,速度还有待进一步提升。基于上述方法本文进行了轻量化的改进,用优秀的轻量级网络Ghost Net作为主干特征提取网络,然后设计新的特征金字塔结构BC-FPN,特征融合时使用加法操作替代原来笨重的拼接操作,提高了检测效率。实验结果表明,轻量化后的模型在牺牲少量精度的情况下,检测速度大幅度提升,能效比表现更好。
其他文献
近年来,幸福河湖成为国家生态文明建设的重点工作,广州市依托“互联网+河长制”积极探索幸福河湖建设,并逐渐摸索出了一条水环境治理的“中国式现代化”道路。本研究基于广州市2012—2022年水污染治理的跟踪调查资料,将幸福河湖划分为“平安之河”“健康之河”“宜居之河”“文化之河”“和谐之河”五个维度,围绕“互联网+河长制”如何赋能幸福河湖建设这一核心问题展开研究分析。
期刊
随着移动定位设备的不断发展与应用,大量移动轨迹得以被采集并保存。如何有效分析这类轨迹数据一直是众多研究者们的关注重点,其中异常轨迹检测作为轨迹数据挖掘的重要部分,被广泛应用于人群轨迹监控、海事船舶运动、灾害天气预警和城市交通管理等领域。在智能化信息时代背景下,公交、出租车等车辆轨迹数据持续增长,本文以车辆移动轨迹数据为研究对象,针对异常轨迹检测问题进行进一步的研究与改进。主要研究内容如下:1.针对
学位
精细化医疗是今年来医学领域研究的重点之一,其核心在于诊疗流程的精细化,包括诊疗环境的精细化和诊疗流程规范的精细化。传统的流程建模工具,如Petri网、业务流程图、实体流图以及面向对象建模工具等,用于诊疗流程的建模能较好的表示流程信息,却难以表示流程所涉及的医学知识。知识图谱由于其能表示事物之间的各种关系,很适合精细化诊疗流程模型的构建。目前,已有大量研究根据精细化的疾病诊疗流程构建了疾病诊疗知识图
学位
PPP模式是公共基础建设领域新兴的一种投融资机制,是PublicPrivate-Partnership的简称,国内将其理解为政府与社会资本合作或公私合营模式。PPP模式为我国改革开放及新型城镇化建设事业注入了新动力,促进了我国基础设施和公共工程项目建设的快速发展。然而,PPP建设项目的运行过程中衍生出各种违规乱象,甚至成为地方政府变相融资、违规举债的渠道。政府审计作为国民经济的免疫系统,对PPP建
学位
随着脑机接口(Brain Computer Interface,BCI)技术的发展,BCI控制系统引起了研究人员的广泛关注,其在残疾人辅助设备上表现突出。在BCI系统中,运动想象(Motor Imagery,MI)由于其自发性特点深受研究人员的喜爱。眼电(Electrooculography,EOG)对于脑电(Electroencephalograph,EEG)是一种伪迹,但EOG具有信号稳定、识
学位
目标检测是计算机视觉领域的一个重要研究方向。近年来,以卷积神经网络为代表的深度学习技术的运用使检测准确度大幅提升。在自然场景图像的目标检测研究中,该领域的学者不断取得显著的成果。基于无锚框的检测方法相比于锚框的检测方法,能够避免过多超参数的设计,冗余框过多带来的繁琐的计算量。遥感场景图像相较于自然场景图像,存在任意方向排列的目标,且目标尺寸变化大,尺寸较小等问题。直接借鉴自然场景下的无锚框目标检测
学位
报纸
单目标跟踪一直是计算机视觉领域研究的经典问题,它是指在一段视频中,根据初始帧已知的目标信息,用边界框在后续帧中实时定位这个目标的具体位置并且估计目标的运动状态。单目标跟踪最初在视频监控领域得到广泛的应用,随着单目标跟踪的发展,逐渐应用于人机交互、医疗诊断、军事制导等领域,并取得了较大的突破。基于深度学习的单目标跟踪算法最大的优势是既保留了相关滤波算法的速度,又利用深度神经网络提高了跟踪器的精度,使
学位
通常在传统的卷积神经网络分类模型中,存在特征信息丢失、光谱特征上下文信息被忽略的问题,且高光谱图像缺乏空间结构特征会存在混淆现象。这些因素会影响高光谱图像的分类性能。但高光谱图像分类技术应用于诸多领域,如在遥感图像处理领域中也被广泛关注,其分类原理是针对高光谱不同公开数据集逐个像素进行地物类型的判别。因此本文基于卷积和长短期记忆网络结构,进一步提升了高光谱图像的分类精度。主要研究内容为:第一,为了
学位
急性髓系白血病是血液系统的恶性肿瘤,主要临床表现为出血、感染、贫血和多器官浸润等,病情进展迅速,病死率高。化疗依然是治疗急性髓系白血病的主要方式,但仍有部分患者死于化疗期。减少化疗期的死亡率和提高治愈率是治疗该病的难点,所以围绕化疗期间增效减毒是中医药的优势和特色。中医认为急性髓系白血病的病因病机为正气虚损与邪毒内伏,故“扶正透毒”这一治疗原则贯穿整个疾病治疗过程。在治疗该病时尤其强调分期论治:化
期刊