单目社交距离检测追踪系统的研究与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:natural_jack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常生活中保持社交距离有助于保护人们的生命财产安全不受侵害,尤其是在疫情时期,保持一定的社交距离是防止病毒传播的有效途径,然而个体并不习惯自己与其他人之间保持2米以上的距离。因此,能够探测行人间距并向他们发出警告的社交距离检测系统可以有效减缓致命疾病的传播。当前,国内外研究人员分别在行人检测、跟踪与距离估计等领域有深入研究,但针对以上领域的融合研究仍相对较少。本文提出了一个包括行人检测、行人追踪与行人间隔距离估计的三阶段社交距离检测追踪模型,并基于此模型开发了单目社交距离检测追踪系统。本文的具体工作如下:1)基于现有的YOLOv5算法提出改进,使用Ghost Bottleneck模块代替YOLOv5算法中Backbone模块的Bottleneck CSP子模块,同时在每个Ghost Bottleneck模块和卷积层之间增加了Squeeze and Excitation模块,在保证检测精度的前提下,提高行人检测的速度,保证系统的实时性能。2)使用改进后DeepSORT方法完成行人跟踪和行人ID匹配工作,在DeepSORT的基础上对卡尔曼滤波的匹配过程进行改进与实现,完成了对视频中被遮挡行人的长时间跟踪。3)基于相互学习的方法,利用谷歌开放数据集(Open Image Datasets,OID)对行人检测追踪模型进行训练,随后使用牛津城镇中心数据集(Oxford Town Center Datasets,OTCD)和自制数据集对模型进行测试,测试结果显示本文提出的模型有较低的身份变化总数(The Total Number of Identity Switches,IDSW)和较高的每秒传输帧数(Frames Per Second,FPS),保证了行人检测和追踪的速度和稳定性。4)研究了单目摄像机的成像原理,使用张氏标定法获得摄像机的内参和畸变参数,随后通过逆透视变换的方法生成感兴趣区域的鸟瞰图,在鸟瞰图中利用比例因子对行人之间的三维空间距离进行估计。在电子科技大学主楼门前的广场进行了测距实验,实验结果表明本文提出的测距方案测距误差保持在10 cm以内,其中平均误差保持在4-6 cm。5)融合行人检测、行人追踪与行人距离估计三个模块,基于PYQT5开发了单目社交距离检测追踪系统,系统包含登录注册、视频采集、参数设置和结果展示四大模块,最后对系统的运行效果进行了展示。
其他文献
超级电容器因其具备瞬时大电流充放电、循环寿命长等特点而获得了较为广泛的关注。除了提高超级电容器本身电化学性能外,器件的多功能化和智能化也成为了研究热点。在目前光能到电能转换存储系统的研究中,由于常规太阳能电池与超级电容器的连接系统过于复杂,增加了能量损耗以及成本,也不满足便携式、可穿戴器件的要求,因此需要制备具有光响应的能量转换存储一体化的器件。例如,具有光敏感性能的超级电容器。制备光电化学性能良
学位
光纤传感器具有体积小、质量轻、抗电磁干扰和制作成本低等优点,可以对许多参量实现无标记、高灵敏度、以及复杂环境下的测量。因此,光纤传感器在现代测量技术的发展中具有良好的潜力和应用价值。长周期光纤光栅(Long period fiber grating,LPFG)由于其特殊的模式耦合,穿透包层的倏消逝波对其表面介质周围折射率(Surrounding refractive index,SRI)、浓度、等
学位
目标的姿态估计一直是计算机视觉的重要课题。对于飞行器的空中姿态进行估计可以得到其姿态信息。该信息可以在对飞行器的下一步动向进行预测时提供一定的依据。目前主流的飞行器姿态估计算法大都基于手动特征提取或者深度学习技术,后者相关算法可以大幅度降低人力成本并且效果及鲁棒性都更加优异。但是目前算法普遍存在着速度过慢、预测误差较大以及移动平台适配不佳等问题。为了对这些问题加以改善,本文对现有算法进行优化从而实
学位
随着信息化移动技术的快速发展,短视频共享平台早已经成为互联网用户日常生活中不可或缺的一部分,人们逐渐热衷于使用短视频共享平台来记录和分享生活。目前,社会中主流的短视频共享平台利用分布式存储技术来存储用户上传的视频数据,借助集群冗余备份机制来保证数据服务的稳定性,但是冗余备份与存储占用空间这两者之间的矛盾仍然是一个亟需解决的技术问题。同时,随着短视频共享平台用户量的爆炸式增长,如何安全存取用户上传的
学位
拉曼光谱技术凭借独特的样品分子指纹信息,以及具有非入侵性、高化学特异性及受水干扰小等优点,使其在癌症诊断、生物学研究和材料等方面有很大的应用前景。但是由于拉曼光谱信息复杂,使其在样品信息解释方面存在挑战,因此需要有效的数据分析方法来解释复杂的光谱数据。随着人工智能技术的发展,越来越多的机器学习算法被应用在拉曼光谱数据处理中,如用于分类建模的有监督学习算法和可用于拉曼成像的聚类分析、谱分解算法以及多
学位
现有的图像检测模型都是对通用目标进行检测,针对复杂背景下的图像小目标检测还存在难以准确识别的问题,特别是远距离小目标聚集与轮廓边缘不清晰时,检测误差较大。小目标在图像中所占面积小、分辨率低,提取的特征很少,进而不容易被检测。合并多个尺度特征信息能够增强小目标的特征,目前针对特征多尺度处理方式通常是采用特征金字塔(Feature Pyramid Networks,FPN),但是在特征金字塔融合的过程
学位
近年来,能源紧张和化石能源产生的环境污染问题急需解决,寻求可再生清洁能源成为材料、能源等学科的重点研究方向。利用传统试错法和密度泛函理论计算的方式寻找光伏材料的错误率高,消耗资源大且耗时久。本工作结合机器学习预测与第一性原理计算,成功预测出高效且稳定的潜在二维钙钛矿材料(Ba2VON3和Sr2VON3),并对材料的能带结构、稳定性、光学吸收谱以及理论最大光电转换效率进行模拟计算,同时研究了碳离子注
学位
随着互联网社交论坛中在线内容的激增,立场检测作为情感分析的一个重要子问题,得到了越来越多的关注与应用。与此同时,针对立场检测的研究也面临了较多挑战,比如静态词嵌入技术对文本上下文语义理解不充分和模型速率较慢等问题。现有的立场检测模型往往只针对单一语言或单一来源的数据集展开研究,也很少有研究者考虑模型的训练及预测速率。为解决上述问题,本文提出了基于DBMPT的立场检测模型,实现了具有立场检测功能模块
学位
大频差可调谐双频激光器在激光干涉测量、光生毫米波、激光雷达等领域有着巨大的应用潜力。常用的双频激光产生方法主要是利用塞曼效应、Sagnac效应、磁光效应、旋光效应和双折射效应等,将一个激光频率分裂以获得两个频率。基于塞曼效应的0.632μm双频He-Ne激光器,因受到Ne原子荧光线宽(1500 MHz)的限制,频率分裂量较小。相比而言,固体荧光线宽要远远大于气体的荧光线宽,通过引入双折射效应获得双
学位
随着人工智能计算能力的日益增强与可获取数据量的日益提高,知识图谱和事件图谱成为计算机领域内相当成熟的一个应用。但由于现有知识图谱和事件图谱大部分由一种语言构成,而一种语言无法对整个世界的知识进行全面描绘。在大数据时代,不同语言的信息共享已成为世界发展趋势。跨语言图谱融合由于多语言间的一词多义、一义多词以及未登录词等问题,一直是一个很难找到最优解决方案的研究难点。跨语言事件图谱融合旨在找到不同语言事
学位