大熊猫行为识别研究与应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:sbtlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉领域中的一个重要方向,也是近年来随着深度学习浪潮兴起的一个研究热点。行为识别技术以图片、视频信息为基础,提取其中时空特征进行学习建模,从而对目标当前的行为动作进行判别,以方便决策人员快速反应并采取相应措施。当前的行为识别技术及其相关研究主要针对人类行为,人类行为定义较为精确,可辨识度高,数据集充足,在近几年人类行为识别技术已经取得了可喜的进展。与人类行为识别方法研究相比,针对大熊猫的行为识别研究存在着如下亟待解决的问题:(1)现实中大熊猫行为数据匮乏,可以获取到的视频数据同质化问题严重。(2)目前没有一个标准的数据集用来评价熊猫行为识别效果。(3)由于体态、环境噪音等多种影响因素,大熊猫姿态模糊、可辨识度低,增加了对这类生物识别的困难(4)从长期发展来看,大熊猫行为识别技术对时间性能有一定要求。针对上述问题,本文提出了两种基于Transformer模型的大熊猫行为识别算法。一种是基于空时信息模型的CNN-Transformer算法,该算法利用卷积神经网络提取视频帧的空间特征图,将特征图压缩为向量并输入到Transformer的encoder部分实现时序建模;另一种是在Transformer中融入卷积运算的ConvTransformer算法,该算法创新性地改进了Transformer模型的计算流程,使得算法可以直接接收特征图作为输入,从而更好地利用数据的空间信息。为了尽可能准确地评估算法,我们收集了一些熊猫视频,并制作了含有五种行为类型的熊猫短视频数据集,同时为了更公正地评估算法,我们还引用了一个常用的人类行为数据集UCF101。实验证明本文提出的算法无论在针对人类行为的UCF101数据集上还是在熊猫短视频数据集上都有着优秀的表现。最后本文实现了一个基于大熊猫行为识别算法的视频检索平台,该平台可以根据用户上传的视频自动进行分类,然后检索数据库中与之最相近的若干视频,并返回给用户界面。
其他文献
无籽果实以其可食率高、口感好和食用方便等优点深受消费者青睐。无籽是果实一个重要经济性状,也是品种选育一项重要指标。未经受精作用而子房发育的单性结实和受精后种子败
根据初夏和初秋两次栽培黑木耳试验,初步分析黑木耳子实体的生长情况及生长期气候条件,结果表明,子实体生长期间高温是感观质量差的主要原因,指出在古田县海拔800m以下地区栽培黑
<正>课本作文有了名师指导,学生一看就会写!名师讲解六十多位全国小学语文名师为三至六年级的同学讲解统编教材课本习作,让学生"想清楚""写明白"。升格范例精心选择一篇中等
领导对下属的负面评价,既影响下属的工作绩效,还影响其社会公民行为。领导负面评价的主要影响因素有领导的个体特征、下属特征和组织情景三个方面,这些因素会对下属绩效、社
使用工业脱氢催化剂,在温度580~635℃、水与甲乙苯质量比2.0~4.0、体积空速0.5~1.5h-1、压力(a)30~101kPa的实验条件范围内,研究了工艺参数对甲乙苯脱氢制甲基苯乙烯反应的影响规律
我们党是执政党,作为执政党,要更好地为人民执好政,掌好权,就必须努力提高执政能力和领导水平.坚持和改善党的领导,提高党的执政能力和领导水平是新形势下党的建设必须着力解
通过对“两课”、大学英语、计算机、高等数学和大学物理5门高校公共基础课教学有效性的调查发现,高校公共基础课教学的总体状况已有较大改观。但是,教学有效知识量低、实用时
目的:总结并归纳膝关节滑膜病变的MRI诊断及鉴别诊断效果。方法:将52例膝关节滑膜病变患者作为研究对象纳入研究,样本挑选时间为2018年5月至2019年4月,分别对纳入的52例患者
3D技术中对衣服下人体的估计有着很多的限制和困难,衣服对身体的遮挡、身体的自我遮挡等都会使得本身受限的问题变得更为困难。现有方法使用多相机或多视角的数据以便获得更多的人体信息,或者致力于单幅RGB图的简单方式进行估计,但面临设备与数据处理复杂和简单数据不能提供足够信息而使结果较差的问题,且大多都没有准确恢复人体的头部和手部状态信息。因此,本文提出了以深度相机单次拍摄RGB-D数据估计任意姿态任意着
自二十世纪八十年代起,词汇作为语言构成中的重要组成部分,已经逐渐得到语言研究者和学习者的广泛认可。在探讨英语学习者的词汇宽度知识的研究中,研究者和英语教师逐渐把研