基于前景提取的双流网络跌倒检测

来源 :常州大学 | 被引量 : 0次 | 上传用户:bigboss555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,中国人口老龄化日趋严重,居家养老逐渐成为常态,独居老人日渐增多。跌倒作为居家老人受到意外伤害的主要方式之一,如若跌倒后得不到及时救助,轻则造成身心伤害,重则危及生命。因此,及时有效地检测居家老人的跌倒情况,具有较大的研究价值和社会意义,逐渐成为研究热点。随着居家监控设备的普及,计算机视觉方法跌倒检测已成为研究重点。论文主要工作如下:针对现有ViBe前景提取算法的鬼影问题,提出了一种融合帧间差分法的改进ViBe前景提取算法。首先,通过使用帧间差分法得到大致的前景运动目标图像,然后通过连点填补法填充由帧差法导致的鬼影问题;接着,对得到的前景运动区域进行图像形态学处理,去除噪点以及平滑轮廓;最后,将ViBe前景提取算法得到的带有鬼影的前景图像和帧差法得到的前景运动区域作与运算,便可以得到准确的前景运动图像。实验过程中,使用该改进算法在三个公开的RGB数据集以及自制的红外热成像数据集上实验。实验结果表明,该改进算法在不同的数据集上均取得了良好的效果,证明了本文对于ViBe算法改进的可行性与有效性。针对现有的RGB跌倒数据集,在改进ViBe算法的基础之上,构建了一种双流卷积神经网络来检测跌倒,将去除鬼影后的准确前景作为空间流网络的输入。首先,使用改进的ViBe算法提取出正确的人体前景,通过多帧合成的方式得到MHI图像,并将其输入双流网络的空间流网络以提取空间维度上的特征;接着,计算TV-L1光流特征图像,使用滑动窗口叠加的方式得到光流栈,并将其输入时间流网络以提取时间维度上的特征;然后,提出了一种改进的双流网络结构模型,以VGG16和Alex Net作为双流网络的主体结构分别提取时间特征和空间特征;最后,提出了一种Sum-Soft Max决策层融合算法来融合两支网络的结果,得到最终的跌倒检测结果。实验过程中,使用该网络模型在三个公开的RGB跌倒数据集上实验并与现有算法对比,实验结果表明,该网络模型在公开数据集上取得了良好的结果,准确率达到了98.7%,高于现有算法模型,可用于室内人员的跌倒检测。
其他文献
近年来,行人重识别技术由于深度学习的发展取得了巨大的进展。然而,目前的行人重识别研究主要是集中在短时间情况下,即行人的衣着不太可能发生改变。这些方法在很大程度上依赖于行人穿着衣物的颜色外观。然而现实中更常见的情况是长时间下,一个人有很大的机会更换衣服,所以现有的方法在此情况下是不可靠的,行人重识别模型应该考虑这种情况。因此,换衣行人重识别任务应运而生,本文针对换衣行人重识别问题,主要做了如下方面的
学位
区块链作为一种去中心化的分布式账本系统受到世界的普遍关注。联盟链作为区块链中的一类,具有高性能、强可控性的特性,其弱中心化的特点也更符合企业属性。因此高性能联盟链系统关键技术研究也是区块链技术研究的一个重要方向。目前对于联盟链系统的性能提升研究主要致力于共识算法的优化,而分片技术的加入能够进一步提高联盟链的扩展性,但是现有的分片协议大多针对公有链系统设计,甚至部分需要硬件依赖。因此,基于联盟链的共
学位
在人体行为识别任务中,基于骨架关节点的模型由于能清晰、直观地表达特征、运算简便,且鲁棒性高,因此倍受关注。但是在传统骨架建模方法中,依然存在空间图构造受预定义影响,忽略了非相邻节点间信息的有效利用,以及常规卷积神经网络对遮挡适应性较差、容易忽略全局特征等问题。针对此,本文在ST-GCN模型基础上,提出几点改进方法,具体如下:(1)提出一种基于全局图遍历的ST-GCN人体行为识别算法。在STGCN模
学位
随着信息技术和人工智能的发展,人脸识别技术的应用越来越广泛,给我们的工作、生活提供了极大的便利。当涉及复杂环境的人脸识别时,人脸识别往往面临很多问题,如遮挡问题、光照变化等。基于这些复杂环境的人脸识别也成为当下研究的热点。针对人脸自遮挡、面部配件、物理遮挡等复杂遮挡问题,本文研究了基于多角度人脸重构和Gabor字典学习的无约束人脸识别。主要包括以下几个方面的内容:首先,许多基于数据、模型分析的方法
学位
任务型对话系统能够以人类语言与用户交流,在多轮交互中监控用户目标,最终完成用户所提供的任务。对话状态追踪是任务型对话系统中承上启下的关键模块,当前研究忽略了槽位与自然语言之间的关联,导致模型无法处理一些特殊的用户表达。此外,传统模型还采用了槽位门控机制并且将对话历史作为输入,这拖累了系统的响应速度,使用户无法获得良好的人机交互体验。针对传统模型忽略了槽位与自然语言之间的关联并且推理速度过慢的问题,
学位
智能手机迅速发展,功能丰富化应用多样化的同时,能耗也不断增加。但由于物理尺寸及电池技术的限制,导致其续航能力得不到提升。智能手机的应用程序离不开网络支持,研究表明,网络请求是造成智能手机耗能的重要原因之一。因此,大量研究者从网络传输方面降低能耗,将网络请求推迟进行合并转发是其中一种方法,但一定程度会影响用户体验。通过对不同使用场景设置不同的延迟时间可在牺牲少量用户体验的前提下降低更多能耗。本文采用
学位
随着农业现代化进程的推进,基于农业领域的知识服务体系成为农业信息化研究的热点问题。传统的信息获取方式以搜索引擎为主,搜索引擎返回大量网页链接,答案高度分散并且呈现多源异构的特点,无法迅速且准确地为农业相关工作者提供知识服务,用户体验感差。领域知识图谱的发展为特定领域内的知识问答提供了高质量的知识库基础。本文基于构建的农业知识图谱,对农业知识问答系统进行研究。主要研究内容如下:(1)构建农业领域知识
学位
行人重识别是在多个摄像头网络中检测特定的行人是否出现的技术。它在智能视频监控系统中扮演了重要角色,并且在公共安全领域有广泛的应用。由于目前摄像头产生的视频数量繁杂,虽然包含了丰富的行人信息,但是需要在数据标注上花费极大的代价。为了减少数据标注的成本,有效地利用视频数据,同时获得鲁棒的模型,本文主要研究基于单标注样本的视频行人重识别方法。针对单标注样本视频行人重识别中特征提取能力弱,伪标签分配错误率
学位
目的:探讨改良悬雍垂腭咽成形术(H-UPPP)在阻塞性睡眠呼吸暂停综合征(OSAS)患者中的应用有效性。方法:选取2020年1月~2021年12月佛山市中医院收治的88例OSAS患者,根据手术方法的不同分为研究组(应用H-UPPP治疗,44例)与对照组[应用低温等离子射频消融术(RFA)治疗,44例]。比较两组动脉血氧饱和度(SpO2)、呼吸暂停低通气指数(AHI)、治疗有效率、嗜睡情况及生存质量
期刊
随着人工智能的快速发展,深度学习技术已经在各个领域中得到广泛应用,包括目标检测、机器翻译、语音识别等。随着研究的深入,将文本、图像和语音等多领域信息进行融合和交互的多模态任务已经引起研究者们的广泛兴趣。其中,视觉问答是多模态学习任务的研究热点之一。视觉问答系统的主要目标是根据图像内容和对应的问题以回答出正确的答案,需解决的问题涉及计算机视觉和自然语言处理等领域。现阶段对于视觉问答的图像表示常采用深
学位