【摘 要】
:
随着深度学习技术和计算机硬件的不断发展,计算机视觉领域开始大规模应用深度学习技术来实现图片的分类、目标的定位和检测等任务。行人检测作为计算机视觉中的一个重要分支在智能监控、人机交互、自动驾驶等领域扮演者重要的角色,也是人体姿态估计、行人追踪等任务的技术前提。行人检测任务是将图片中包含的行人目标以包围框的形式标记出来。随着深度学习技术的应用,行人检测的准确度有了很大的提升,但仍然存在很多问题。其一,
论文部分内容阅读
随着深度学习技术和计算机硬件的不断发展,计算机视觉领域开始大规模应用深度学习技术来实现图片的分类、目标的定位和检测等任务。行人检测作为计算机视觉中的一个重要分支在智能监控、人机交互、自动驾驶等领域扮演者重要的角色,也是人体姿态估计、行人追踪等任务的技术前提。行人检测任务是将图片中包含的行人目标以包围框的形式标记出来。随着深度学习技术的应用,行人检测的准确度有了很大的提升,但仍然存在很多问题。其一,行人遮挡仍然是行人检测任务中具有挑战性的问题;其二,深度学习检测算法很难在计算力有限的嵌入式设备或移动端上部署和应用。针对以上问题,本文的主要工作内容和成果如下:(1)实现了针对行人遮挡问题的CSP算法的改进。通过行人头部特征来帮助行人整体检测的思路,对CSP算法进行改进。在特征提取模块中增加对行人头部特征的提取来增强行人整体特征,并且为了使算法在不增加计算量的前提下有更好的多尺度目标检测能力,采用金字塔插值方法进行特征图上采样。为了增强行人头部特征和行人整体特征的表达能力,在检测头模块中,增加行人头部和行人整体的单独检测,并且采用多任务联合方式进行训练。改进后的算法对行人遮挡目标以及多尺度目标都有更好的检测准确度。(2)实现了算法的加速优化。通过采用轻量化骨干网络MobileNetV2和TensorRT加速库两种方式对算法进行优化,前者减少了算法的参数量,后者优化了网络结构,并通过参数的低精度表示加快了算法的检测速度。在嵌入式设备Nvidia Jetson Nano上能够做到实时检测的效果。(3)设计并实现了行人检测系统。该系统通过本文实现并优化的行人检测算法实时处理摄像机中的视频流,将检测到的行人目标以图片的形式发送给用户的Android客户端,用户也可以通过客户端来查看监控的实时画面或录像视频。
其他文献
在诸如银行、移动营业厅等实际应用场景下,借助人脸识别系统,可以快速完成对客户的实名认证,并自动办理相关业务。然而,客户在实名认证的过程中,需上传自己的人像照片或实时拍摄人像照片,然后与身份证照片进行核对。此时,若客户提供的人像照片的质量很差,会严重影响人脸识别算法的性能,从而影响自主办理业务的效率。因此,对人像照片的质量审核显得尤为重要。基于此,本文针对影响人脸图像质量的多个因素进行分析,设计并实
丢包区分一直是TCP拥塞控制的研究热点和棘手问题。由于LEO卫星网络的高动态性使得数据包丢失概率急剧增加。若无法准确判别数据包丢失类型,采用不恰当的窗口调整策略,将严重影响数据包传输速率,无法高效利用网络带宽。此外,相比于地面网络,这种高动态性导致的数据流概念漂移问题更加严重,极大的影响丢包区分模型的精度。本文基于TCP拥塞控制机制,通过构建概念漂移检测模型解决样本分布变化对丢包区分模型的影响,提
人类视觉系统具有强大的信息处理能力,人类可以在很短的时间内找到他们感兴趣的领域,即显著性区域。通过计算机视觉相关算法提取图像或视频中显著区域的技术即为显著性检测技术。近年来随着技术的发展以及对信息处理速度的要求,使得显著性检测技术受到关注并取得了很大进步。传统的显著物体检测方法致力于检测显著物体所在的区域。但是当人们集中精力时,通常只关注物体的一部分,而不是整个目标。因此,通过检测眼动情况来检测注
随着互联网的蓬勃发展,越来越多的应用对时延的稳定有着严格的要求,互联网“尽力而为”的传输方式已经不能满足需求,所以确定性网络应运而生。确定性网络是IETF提出的一种新的网络架构,拥有资源预留、服务保障和显式路由三大技术,可以提供极低的丢包率和严格的时延抖动的通信服务。但是由于确定性网络是一种新出现的网络技术,依然存在一些问题。针对缺乏符合确定性网络特点的路由算法的问题,本文研究了Bhandari算
随着无线通信技术和物联网技术的发展,无线mesh网络逐渐呈现异构化趋势。相比于同构无线mesh网络,异构无线mesh网络将各种网络架构、传输速率、传输距离和频谱资源存在差异的网络融合为一个整体,可以有效的提升网络覆盖面积和服务质量(Quality of Service,QoS),因此近年来备受学术界和工业界的关注。由于架构和链路的异构性特点,异构无线mesh网络更加适合解决多种类型业务的QoS需求
随着5G/6G无线通信系统的发展,毫米波/太赫兹应用受到了越来越多的研究。毫米波/太赫兹高频段技术能够实现大宽带、高速率、低时延、高集成的特性,在医疗、生物检测、遥感、安全、无线通信等领域有着广泛的应用。由于60GHz频段处于氧气吸收峰,信号可快速衰减,可应用于短距离高速无线通信。140GHz的电磁波在大气外几乎无衰减,可应用于宇航间通信。高增益、高效率的60GHz/140GHz宽带毫米波/太赫兹
在人工智能迅速发展的背景下,基于深度学习的任务型对话系统由于其广阔的应用场景以及丰富的技术挑战一直受到广泛的关注。越来越复杂的使用场景也催生了多领域任务型对话系统的出现,例如智能助手在帮助预定车票时,也需要关注目的地的住宿情况。利用单领域叠加的方式会存在槽位共享困难、系统调用混乱等问题,难以适用于复杂的多领域场景。在领域较多时,当前研究存在着对话状态追踪准确率不高的问题,应对愈发庞大的本体数量、以
语义分割将原始生物医学图像数据转换为有意义的、空间结构化的信息,因此在医学影像分析研究中起着至关重要的作用。尽管最近基于深度学习的分割方法取得了成功,但它们受制于医疗影像数据集样本数量比较少,导致其模型泛化性不够理想。尤其脑部胶质瘤的位置、大小、形状的特异性较强,导致人工标注数据难度大容易产生误判和分歧从而造成标签噪声,并对泛化性提出了更高的挑战。针对这一问题,从数据增强角度,本文提出了一种数据增
声学场景分类旨在利用对音频信号的处理和分析来获取音频所描述的场景环境,该领域的发展使数据集不断得到补充和丰富,多样的数据集意味着数据分布的不一致化,分布不一致则会进一步影响声学场景分类的表现。因此,本文提出了基于对抗域适应的声学场景分类方法,通过特征对齐来减缓数据分布不一致对声学场景分类性能的影响。首先,跨设备采集会使音频信号产生一定的畸变,导致数据分布不一致,为了解决该问题,本文提出基于熵加权和
一个偶然的机会,北京的一群文化人聚集在大连,被安排在棒槌岛宾馆过了几天神仙日子。其中,最年长者是汪曾祺,最年幼者是我。近年,汪先生无论走到哪里,总是随身带着印章,遇到别人求字求画,只稍稍推辞两句,然后就答