论文部分内容阅读
基于视觉的运动人体的行为识别有着广泛的应用前景,但大量的成果都集中在模版匹配法,状态空间法。这两种方法的识别结果与人类的理解存在语义鸿沟,基于语义方法可以克服这个缺陷成果却很少。论文的主要目的是研究融入场景敏感度、人物身份的运动人体行为的语义计算方法,为实现此目的进行了以下几方面的研究:1.研究了基于Beowulf机群中改进的粒子滤波的3D人体运动跟踪算法。新算法通过三维人体模型参数的自动初始化、粒子数目和模板的调整来实现跟踪失效的自动恢复,基于任务动态分配策略和低开销通信策略设计了Beowulf机群中的迁移式粒子滤波并行算法解决粒子退化问题和提高计算速度。2.为提高场景识别率和提取场景高层语义,提出了基于四层树状语义模型的场景语义识别新方法。四层语义模型包括视觉层、概念层、关系层和语义层。提取训练样本场景实物的颜色、颜色层次和轮廓得到视觉层;同类场景中实物的名称(概念单词)交集构成了概念层;统计概念单词的频率并对概念单词的空间位置关系进行关联规则的数据挖掘得到关系层;计算关键概念单词与PSB标准模型语义属性分类树的语义相似度得到场景高层语义。计算测试样本的底层特征后,通过视觉层的检索得到概念单词。通过概念单词的频率和空间位置关系关联规则的检索得到场景分类。由场景分类、场景高层语义、场景概念单词构成场景语义的识别结果。3.为提高身份识别率和降低识别时间,提出了一种人体身份识别的认知物理学方法。该方法将人脸特征和步态特征用数据场进行表征,利用数据间的相互作用和运动实现数据的自组织聚类,以这种非线性变换的方式实现身份特征数据的降维。对降维后的样本库以最大势函数值进行排序,实现了离散点快速检测和样本检测的二分法查找。基于改进后的D-S证据论对人脸和步态进行融合。4.现有的语义方法未融入场景语义和人物身份,缺乏对复杂行为的有效识别和描述。提出了一种基于层次化概念空间的视频图像中人体行为语义计算新方法,该方法引入认知学的概念空间,建立了层次化的运动概念空间。将复杂的运动分解为原子运动概念层、简单行为概念层和事件行为概念层。原子运动层细分为身体移动、肢体和姿态的原子运动,从大尺度、小尺度和中尺度提取了人体运动的特征。概念激活函数实现了原子运动的检测,时空逻辑规则实现了简单行为语义的识别。提出的七元组语义模型融入了场景语义和人物身份,实现了事件行为的建模和识别。