论文部分内容阅读
二十世纪九十年代以来,随着运动捕捉技术的发展,大量的三维人体运动捕捉数据库被建立起来并广泛应用于手势识别的研究当中。正确高效的分析处理这些三维人体运动数据,对大规模三维运动捕捉数据库的开发和利用,从视频信息中提取出来的三维人体运动信息的后续应用都有着重要的意义。近年来基于运动捕捉数据的研究开始致力于在抽象层次上对运动数据进行语义分析。
本文主要利用运动捕捉的三维手势数据库,对日常交流的手势进行特征提取和语义的分类研究,主要工作包括:
●采用运动捕捉的方法建立了三维手势数据库。我们利用运动捕捉设备采集了包含30个人的450个手势序列。该数据库主要针对人们日常交流中的双手手臂的动作,为日常会话手势的识别提供了很好的测试库。
●开发了一个简易的人体骨架模型,该模型可对无效的运动数据进行修补并直观的显示捕捉的动作。为了便于数据的后续应用,将采集到的.trc数据格式转换成四元数的格式进行表达。
●在特征提取方面,从底层特征出发,提出了一些新颖的具有语义信息的运动属性特征。通过对手势中人体部分之间的关系,手势的时空特征的分析,提取了双手的运动协调度,关键帧以及运动的周期性这三个运动属性特征。这些特征是连接传统的底层特征和高层语义之间的桥梁,为未来基于语义的手势识别提供良好的研究基础。
●在分类器的构建方面,我们通过构建一个三层的分类树,把提取的有语义信息的运动属性特征融合在树的结构中。我们对不同的属性特征分别构建诸如GentleBoost,Nearest-Neighbour等单特征分类器,基于人们运动属性的一些先验,把分类的结果进行融合并形成一个树状的分类结构。