基于特征映射的运动分析与识别

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:jerrylucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别和机器学习领域中,生成式模型中和判别式模型是两个重要的识别方法。而特征映射则提供了一种从生成式模型中提取能够描述样本的特征的方法,从而与判别式模型结合。这种混合生成式模型和判别式模型的方法,不仅拥有生成式模型擅长对数据建模和发掘隐变量信息的优点,而且可以利用判别式模型强有力的决定类间边界的区分能力。因此在计算机视觉中运动分析与识别领域,如人体动作识别,场景识别,人脸识别,群体运动分析等,都有着重要的研究潜力和应用前景。在大量阅读文献的基础上,作者对现有的特征映射方法进行做了细致的分析和研究,并将其扩展,提出一种获得多类特征映射的方法。接下来在人体动作识别,群体运动分析以及单样本人脸识别三个挑战性的计算机视觉与模式识别的问题上,通过将生成式模型的特征映射与判别式模型或者聚类分析方法结合,取得了一些有价值的实验结论:(1)在人体三维动作识别的问题上,提出来一种在三维人体关节点序列上基于特征映射的识别方法。该方法建立在隐马尔可夫模型上,与过去方法不同之处在于将隐马尔可夫模型与判别式模型结合的方式,这种方式可以提取更有区别能力的信息。我们将人体多关节信息分成多个有重叠的包含语义信息的子部分,对每一个子部分用隐马尔可夫模型进行建模分析,并通过后验分歧的多类扩展得到特征映射,最终得到该序列的完整特征映射信息。然后利用支持向量机对提取的等维度特征映射向量进行训练和分类,进而对序列进行识别。识别的结果与已发表的动作识别算法比较,得到了更好的结果。(2)在复杂场景的群体运动分析的问题上,提出来一种开发隐藏信息的基于特征映射的聚类分析方法。该方法建立于从视频中提取的短轨迹的基础之上。把群体运动分析视作一个从概率角度将长轨迹聚类的过程,实验证明这种方法效果很鲁棒。通过特征映射的应用,可以开发出长轨迹的隐信息,这种隐信息相对于可观测的信息来说,在聚类分析上更为有效,更具区别性。通过提出的聚类分析方法,可以得到较好的分析结果。(3)在单样本人脸识别的问题上,提出一种新的基于部分的数据表示方法,多子类表示。该方法引入多个子类的概念到一个概率生成模型中来模拟生成人脸的过程。该方法不需要有监督的机器学习。一旦训练结束,对于一个新的人脸测试样本,可以看作是一个学习好的多子类的部分的结合,而样本在这些子模型上的映射就是得到的特征映射。最后通过相似度比较进行识别。由于该人脸表示方法为生成式模型,所以通过特征映射方法可以提取隐藏的有区分能力的结构性信息。本方法对于光线的改变和遮挡有较强的鲁棒性。
其他文献
该文针对银行业务中的网络计算环境,以用户指纹验证取代传统的身份验证方式,采用当前最为流行的三层C/S体系结构,设计并实现了指纹自动识别管理信息系统,对系统各部分的功能
该文以在我国钢铁企业较为普遍的五机架四辊冷连轧机为背景,通过对宝钢2030mm冷连轧机系统轧机系统轧制过程与设备的分析,建立五机架冷连轧动态模型,并对该模型进行了辨识与
该文首行介绍了Sampath等提出了的逻辑DES的故障诊断方法,这是一种基于事件(event-based)模型的方法.该文采用了另一种更压缩的,由Alur等提出的TFSMA框加实现了赋时DES的基于
Agent技术是人工智能和计算机科学领域内新兴的研究热点.自治Agent和多Agent系统为复杂软件系统的分析、设计和实现提供了新的思路.目前,Agent技术的应用领域越来越广泛,从相
该论文研究了在控制领域运用线性矩阵不等式的方法,着重研究了时滞不确定系统的控制问题.文中包括以下内容:1.第2章讨论了保证性能控制问题.不确定系统含有多重时滞,通过设计
摘要:本论文首先介绍了包装印刷传动系统的工作原理、检测方法、微机控制方式,然后针对包装印刷传动系统中的参数变化、拖动负载变化、非线性等特点,研究开发了一种智能型的包装
传统的控制与辨识理论主要是基于线性系统的,对非线性系统没有通用的分析方法.八十年代中期以来,随着对人工神经网络研究的复兴,其在辨识与控制领域的应用越来越广泛.步入九
燃料电池是一种不需要直接燃烧,通过电化学反应把蕴含在燃烧气体和氧化剂气体中的化学能连续转换成电能的发电装置,是高效、清洁的全新发电方式,熔融碳酸盐燃烧电池(MCFC)是
该论文以滚动轴承状检测、故障诊断为研究目标.首先,系统地分析了轴承振动与噪声具有密切的关系;其次,针对我国轴承振动测量仪存在的不足,提出并研究设计了一种以计算机为核
学位