【摘 要】
:
静态图像中的人体行为识别是图像处理领域的热门研究方向之一。正确的识别静态图像中的人体行为,有助于图像的分类、检索以及视频监控和人体追踪等应用。本文中选取Imagenet
论文部分内容阅读
静态图像中的人体行为识别是图像处理领域的热门研究方向之一。正确的识别静态图像中的人体行为,有助于图像的分类、检索以及视频监控和人体追踪等应用。本文中选取Imagenet数据集中的10类人体行为进行人体行为识别算法的研究。首先,研究了基于浅层特征的行为识别理论,采用了基于分布式行为图像区域的行为识别算法。将人体划分为姿态部位,通过距离度量的方法找到具有相似结构的图像区域作为数据正样本,训练得到分类模型。并将该算法与经典的梯度方向直方图、可形变部件模型的算法进行了对比实验,基于分布式行为图像区域的行为识别算法取得了更优的分类结果。其次,根据人体的视觉感知机制,提出了基于语义显著图的人体行为识别算法。通过滑动窗口和相似性度量的结合方法,找到最能展现图像语义特征的行为区域,即为语义显著区域,以语义显著区域和原始图像作为双输入源进行了人体行为识别的研究,增强了图像中显著区域信息的利用率,更好的展现了图像的可识别区域,有助于人体行为的识别。最后,根据人体非刚性运动的特征,将人体部位划入不同的通道,更加细致的表现了人体的行为语义,分析不同通道的行为识别效果,提出了5-通道的行为识别算法,根据对应的通道划分准则,形成了D-Imagenet数据集。在5个通道,3个层次上进行卷积神经网络CNN特征提取以及基于SVM的分类器训练。该算法细化了特征,有效的解决了人体行为识别类别之间相似、类内差异大的问题。
其他文献
本文章介绍了内蒙古生活垃圾处理处置设施现状,对不同垃圾处理设施处理能力与不同垃圾处理设施投资进行分析,对内蒙古自治区生活垃圾处理的未来发展提出建议。
通过梳理西方古代至19世纪园林的演变过程,探讨了景观规划设计方法发展形成的因由及其未来发展的趋势。通过研究景观形成的外部驱动力及解析相对案例,得出西方传统园林、自然
介绍了制备N-羟基丁二酰亚胺的一般方法,研究了采用丁二酸酐与盐酸羟胺制备N-羟基丁二酰亚胺水合物的工艺方法,以及从一水合N-羟基丁二酰亚胺出发制备高纯度无水N-羟基丁二酰
中医药是中华文化、中华文明走向全球的成功名片。云南省是我国对外开放的桥头堡之一,也是中医药资源大省。本文探讨在"一带一路"战略背景下,结合中国与东盟国家建立的自由贸
视唱练耳是音乐教学的基础,结合学前儿童的自身特点,此时完全可以进行初步音乐教学,让他们在培养音乐兴趣的同时建立起音乐基础。本文首先对视唱练耳音乐教学的基本含义进行
在经济危机爆发的背景下,通货膨胀作为危机中不可缺少的元素将影响到投资的时机和策略,更关系到国家宏观调控政策的制定。本文分析了18年的权威统计数据,对通货膨胀背景下的
<正>互联网时代,单个的研究者如果只投身于某一专精但狭隘的学术领域,独自探索的学术路径已被证明越来越难有建树和创造性的革新。各专业信息的共享已然跨界跨领域地飞速扩张
过去的十年,是新媒体飞速发展的十年,也是中国人的阅读习惯悄然改变的十年。如今,不要说80后、90后少有阅读报纸杂志的爱好,就连不少60后、70后也养成了从网络上获取信息的习惯。
Internet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。文章就Web挖掘技术的概念、分类及文本挖掘和用户访问模式挖掘的实现技术做
合理量的期铜操作能够降低或锁定一段时期电缆生产和库存成本,解决销售、投标过程中因铜价上涨给企业带来的履约困惑,且占用资金不多,是规避因铜价波动给电缆成本带来风险的