基于深度学习的行李取放行为算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:YY_SQYZ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,如何应用它改善人们的生活的正在成为研究热点。在实际列车车厢中,人流量较大,因此很容易出现错拿行李、盗拿行李的情况,仅通过人力来判断行李取放十分困难,因此,针对该场景研究动作识别算法,以行李取放行为为切入点,进行动作识别分析具有重要的研究意义和实际价值。在模拟车厢场景搜集并标注的行李取放的图片的基础上,设计并在这些数据上训练了一系列高精度且兼顾实时性的模型。具体而言,针对基于关键点检测的人物交互检测算法PPDM,其交互中心点设置的位置不适用取放行为的检测的情形,修改了交互中心点预测位置,并借鉴其他融合姿态信息的网络提升关键点检测能力。同时,在进一步提升人物交互检测算法对行李取放识别性能的基础上,分离出交互检测算法实现动作识别的核心模块目标检测分支和姿态分支,分别探究边界框标注、数据增强对目标检测表现的影响,以及基于姿态估计网络的关键点位置,手工特征设计与机器特征学习对动作检测的影响,并在这两者基础上,探究模型融合策略对最终动作检测效果的提升。实际测试表明,针对取放行为专门优化的交互点检测方案与添加的姿态分支,能在原方法基准上提升分类的精确率与召回率;经过数据增强的目标检测与基于多层感知机处理姿态信息的检测方法的精确率与召回率均超过了90%,在此基础上,对目标检测和姿态估计的输出进行模型融合以损失一定实时性的代价对行李取放取得了最好的识别效果。
其他文献
在互联网技术高度发达的今天,爆炸式增加的信息量促使了自动文本摘要技术的诞生,文本摘要技术能够帮助人们快速分析和理解文本信息。现实中描述同一事物的文档通常不止一篇,这些文档一般由不同作者在不同时间撰写,表达不同的主题信息。现有的多文档自动摘要旨在尽可能地概括源文档中的所有信息,主题信息的缺乏使得摘要的生成不够精准,与实际需求仍有较大差距。另外,现有的多文档自动摘要对文档间关系的把握也不够准确,导致生
学位
由于大数据时代数据量的日益膨胀,本地的计算与存储资源已无法满足人们的需求,越来越多的企业和用户选择云存储作为解决方案,与此同时云存储的隐私安全问题成为限制其发展的最大因素。将数据加密后上传可有效解决这一问题,但这样也降低了数据的可用性,难以对密文执行诸如关键字检索之类的常用操作。对称可搜索加密允许用户安全地将数据库外包到半可信的云服务器,并保留了对加密数据库进行关键字检索的功能。考虑到实际应用中增
学位
CPSS(Cyber-Physical-Social Systems)中包含了丰富的异构网络,对异构网络进行聚类分析有助于发现网络中浅层的数据特征,采用张量统一表征异构网络有助于融合多源异构数据,而目前针对异构网络的聚类分析面临如下问题:现有算法无法实现对异构网络的不同类型对象的聚类、且无法充分利用异构网络的稀疏特性。为了有效利用异构网络中丰富的语义信息,对多种类型的对象实现聚类,论文首先介绍了张
学位
大数据时代催生的基于信息空间、物理空间以及社会空间的人机物系统中的数据具有高度复杂性和丰富的语义信息,如何对如此大规模的多源异构数据进行价值提取以及分析,如人类活动性研究,成为社会各界研究不休的热点议题之一。其中,在处理人类活动的时序数据上,传统的隐马尔可夫模型虽然能够适用于大部分的应用场景,但囿于其本身理想化的前提假设条件,使得模型在一些关系更为复杂的实际应用分析中显得力不从心。针对传统隐马尔可
学位
图是节点和边的集合。对图的研究是在探究聚类算法过程中人们逐渐感兴趣的一个话题,图聚类可以对网络进行划分归类,通过获知节点的特征以及参考图网络的结构来把数据划分到不同簇中。由于现实世界存在海量的多源异构数据,传统的用数值或者向量表示的图节点和图结构已经逐渐不能满足对复杂数据的描述,所以引入张量这一概念来更充分地表示样本节点,同时也从多个角度利用图结构更全面地探索节点间关系。当多个参与者想协同进行图聚
学位
精确地定位与导航系统给人们出行和生活带来了巨大的便利,也是当今生活中必不可少的一部分。当前相对成熟的导航系统都是基于室外场景,而在室内场景,大多无法继续使用。随着室内和室外定位研究成果的普及,构建一个适用于多场景的无缝定位与导航系统成为导航领域的研究热点。针对以上问题,设计并实现了适用于室内和室外的无缝定位与导航系统。首先在室内地图构建阶段,针对室内地图包含建筑物、楼层和区域的特征,设计了分层分区
学位
基于计算机视觉的定位方法已经引起越来越多研究者的关注。由于成本低、不需要物理接触等特点,这类方法已经广泛被应用于机器人以及自动驾驶等领域。传统基于视觉的定位方法往往利用单一视觉传感器进行定位,由于视觉传感器本身的缺陷,这类方法鲁棒性较低,且存在着较大的精度损失,因此在实际应用当中面临诸多问题。对单目相机结合惯性测量单元定位的方式进行了研究,设计并实现了一套能够实现完整定位流程的定位系统。该系统包含
学位
深度卷积神经网络中有庞大的训练数据,海量的网络训练参数,因此计算量巨大,占存储空间大。大型的深度神经网络由于参数众多,成为制约深度学习应用的瓶颈之一。COStream数据流编程框架搭建的卷积神经网络中亟待解决的是保持现有结构的同时,消除网络中参数的冗余,使精简后的模型结构更加符合实际任务的需求。针对目前COStream数据流编程框架中暂不支持对于卷积神经网络优化的问题,对COStream的文法语法
学位
随着科技生产力的提高与经济的发展,人们的生活节奏越来越快,对车辆等交通工具的需求也在不断增长。日益增多的车辆无疑给城市交通带来了巨大的压力,在交通路口频繁堵塞、交通事故层出不穷的今天,智能交通系统的建设与管理便尤为重要。对交通路口的监测往往是通过监控摄像来实现的,其中包含大量的视频与图像数据,因此智能图像检测技术对于城市交通的智能化管理具有重要意义。对智能交通中的重要关注对象——车辆与车牌进行了基
学位
单层网壳结构因其造型美观、结构简洁、受力性能优良应用到越来越多的建筑物中。单层网壳节点设计是结构设计的关键,节点的安全性对整体结构的影响非常大,节点一旦失效破坏,会造成整体结构的应力重分布,严重的还会导致建筑物的坍塌。本文结合武汉月亮湾艺廊结构初期设计,针对KK型关键钢节点开展有限元分析,研究三种不同构造形式的KK节点在设计荷载下的承载力稳定性,明确节点的局部应力分布特征,找到节点的薄弱位置,改变
学位