一种端到端的多尺度摔倒检测算法

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:coosmic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十几年中,多种摔倒检测算法被相继提出,但目前的基于深度学习的计算机视觉摔倒检测算法仍存在以下问题:(1)多数方法使用两个网络对目标进行分类和摔倒判定,会导致特征被重复两次提取,造成算法的冗余。(2)现有的摔倒检测数据集中包含的小目标样本过少,造成小目标检测的准确率低。(3)网络模型的深度不够进一步造成小目标检测的准确率低。(4)网络模型仅是对状态的检测,对于类似摔倒行为会造成误判。(5)网络模型无法对部分被遮挡的目标进行检测。(6)模型参数过多会大量消耗服务器的性能,降低检测的实时性。针对以上问题,本文提出一种端到端的多尺度摔倒检测算法。该方法将摔倒判定看作是分类问题置于目标检测网络中,利用一个网络实现端到端的摔倒检测。对模型中的残差模块进行改进,通过增加残差边的方式提高网络模型的特征提取深度;提出了树形特征提取网络作为辅助特征提取模块,使用多级融合的方式对特征进行提取,提高小目标的检测准确率。为解决网络训练难收敛的问题,提出两步走的训练思想,第一步先将适用于检测的网络层解冻训练,使部分网络层对于训练集有记忆;第二步再解冻所有层,训练整体网络,加快网络收敛速度,节省资源。拍摄小目标样本和部分被遮挡目标的数据集并处理,与蒙特利尔大学公开的摔倒检测数据集进行融合,建立摔倒检测融合数据集,通过K-means算法更新Anchor值,提高小目标检测的准确率。利用状态机的思想,提出摔倒判别器。利用不同阈值对不同状态进行判定,减少“假摔倒”造成误判的可能。将构建好的网络模型托管在Docker中,在Docker中对网络模型进行训练和预测,减少服务器的性能消耗增加了检测的实时性,进行统一部署免去工程化的繁琐流程,弥补目标检测算法的劣势。本文对不同场景不同姿势的摔倒进行了实验,实验中精确率和召回率分别达到97.20%和96.20%,m AP达到95.60%,对视频流的检测速度可以达到28.9FPS,很好的满足了实时监测的要求。
其他文献
开绕组永磁同步电机具备可大功率场合运行、电压利用率高、容错控制好等优势成为目前研究的热点,但是开绕组永磁同步电机结构复杂,在电机功能性测试中,成本高、能耗多。再考虑到独立电源供电时,开绕组永磁同步电机存在零序电流,影响系统性能。因此替代实体电机完成功率级测试以及有效的抑制零序电流的产生是本课题研究的意义所在。建立在开绕组永磁同步电机数学模型基础上,对独立电源供电的双逆变器结构存在零序特性等问题进行
学位
近年来,机器学习技术的不断深入研究发展使其在各个领域中都获得了巨大的成功,如语音识别、图像处理以及个性化推荐等。为了提供更加精确和多样化的服务,机器学习技术需要进行海量的数据收集与训练。然而,这些用来训练的用户数据通常涉及个人的敏感信息,直接将用户数据用于模型训练将存在泄露用户隐私的风险。因此,亟需一种有效的隐私保护方案使得数据隐私得到保障。本地差分隐私作为一种新兴的隐私保护方法,与传统差分隐私不
学位
计算机取证技术是网络安全应急响应的基本步骤,恶意软件在计算机系统中执行的异常或未授权操作,可通过分析系统的磁盘驱动器或物理内存进行检测。近年来,常见的内存注入攻击不会将关键的数据写入磁盘,这使得传统的磁盘取证无法取得有效的数字证据,而针对易失性存储器的内存取证技术逐渐在数字取证领域中发挥出不可替代的作用。目前内存取证领域几乎只关注系统的内核地址空间,而对用户地址空间的研究较少,常见的内存注入攻击技
学位
随着化工技术愈加成熟、化工产品愈加丰富,房屋建筑和室内装修使用的新型建筑材料,在带来优良性能的同时也释放了有害气体。而有超过80%的人在室内时间超过一半,且随着疫情的频发,人们居家办公,学生居家上网课,时间还在增加。此外,多数居民通过喷洒酒精进行室内消毒,但当乙醇的浓度超过3%时,易引发火灾。家居微环境的污染已经成为现代人最大安全隐患之一。因此制备室内污染气体传感器迫在眉睫,本文基于聚苯胺/二氧化
学位
近年来,随着三维成像技术的迅速发展,三维点云的数量呈现出爆炸式的增长。由于点云数据能够最大程度地保留三维模型的几何信息,其逐渐被应用于很多领域中,如场景理解、自动驾驶以及机器人等。随着点云数据的增多,采取人工方式对其进行分类的方式变得不再可行。因此,如何快速准确地对三维模型进行分类标注成为当前亟待解决的问题。三维空间中的点具有无序性、稀疏性以及高维性等特点,且在空间上存在一定的位置关系。然而,常规
学位
随着信息时代的飞速发展,人们与互联网的联系越来越密切,近年来汇集了人工智能、自然语言处理和认知科学等多个领域的情感识别技术也随之得到了井喷式的发展。人类的情感通常通过自然语言、语音以及面部和肢体语言所共同表达出来。现如今视频社交行业飞速崛起,越来越多的用户通过短视频来输出观点,网上多模态内容的数量呈指数级增长,情感识别技术也从最初的单模态情感识别逐渐演变成多模态情感识别。对人物在多种模态下所表达出
学位
目的 明确宁夏腹泻患者致泻大肠埃希氏菌(diarrheagenic escherichia coli,DEC)的分布规律和流行趋势,掌握其耐药特征,为宁夏食源性疾病的预防控制提供科学依据。方法 2016—2021年共收集15家哨点医院门诊及住院食源性疾病腹泻患者新鲜粪便样本7 042份,进行DEC分离培养、生化鉴定、荧光PCR毒力基因分型,微量肉汤稀释法抗生素药敏试验。结果 7 042份腹泻患者样
期刊
随着社会和科技的飞速发展,道路上的车辆越来越多,智慧交通和无人驾驶汽车将成为未来交通的趋势。在智慧交通和无人驾驶汽车技术中,多目标车辆跟踪则成为不可或缺的一环。国内外众多学者在多目标车辆跟踪领域展开重点研究,虽然取得了成果,但是仍存在一些难题。例如当跟踪的车辆较多、车辆发生形变、车辆相互遮挡或者行车环境复杂时,车辆跟踪效果就会变差。本文围绕上述多目标跟踪算法存在的问题,对车辆检测和车辆跟踪的算法进
学位
图像分割是计算机视觉领域的研究重点。传统的图像分割方法基于像素点处理图像,没有考虑到像素点之间的空间与颜色等信息关联,分割效率较低。为了提高图像分割的质量和效率,本文利用图像像素点之间的信息相似性将图像划分为尺寸相当的多个区域块,即超像素。超像素把图像处理的基本单位由像素点级转变为像素块级,能够减少所需处理的信息数量,为后续的图像处理降低复杂度,提升图像分割的有效性。针对当前的密度聚类分割方法存在
学位
伴随社会的发展,车辆在现如今已经得到了广泛的应用,在给人类带来便利的同时,也产生了许多难以忽略的安全问题。尤其是在智能交通逐渐丰富社会治理体系的当下,对于车辆的分类识别逐渐成为智能交通的关键领域之一。其中,摄像头采集到的车辆信息可以加快事件处理进程,但摄像头采集到的图像易受环境的影响,造成信息量的大幅降低。因此,对于模糊图像的增强处理以及车辆图像的分类方法研究具有重要的现实意义。根据对图像增强算法
学位