基于局部时空特征的人体行为切分与识别方法若干关键技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liuyc077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉领域的研究热点和难点,在智能监控、高级人机交互、体育运动分析和基于语义的视频检索等方面有着重要的意义和广阔的应用前景。计算机理解人体动作和行为将成为未来高层计算机视觉技术发展的重要方向。目前,人体行为识别的研究尚处于初级阶段,尽管在单一背景的简单动作识别上取得了一定的进展,但是由于人体行为的复杂性、场景的多样性等问题,真实场景下的行为识别仍然面临着许多困难。针对上述情况,本文围绕基于视频的人体行为识别展开研究,进行了以下三个方面的工作:   1.归纳总结现有方法。查阅大量文献,对国内外计算机视觉领域的人体行为识别方法进行全面的归纳和总结,详细介绍了常用方法的基本思想和原理,并分析比较了各方法的优缺点。   2.提出了一种基于熵的特征筛选方法。针对局部时空特征提取存在噪声和干扰等问题,本文通过计算特征点之间的熵,对检测到的局部动作特征进行筛选,剔除不良码本项,同时结合局部特征描述算子大多使用直方图进行特征表示的特性,使用改进的直方图相交核作为特征相似度的衡量方法。在KTH数据集上的实验结果表明该方法增强了特征码本的判别能力,提高了识别效果。   3.提出了基于条件随机场的连续行为切分识别模型。针对复杂行为切分困难和识别率不佳的问题,本文借鉴中文词性标注中分词与标注同时进行的方式,将条件随机场模型与支持向量机相结合,建立连续行为的切分识别模型。通过对输入的图像序列进行基于光流的关键帧检测,将图像序列切分为动作基元片段,并对其进行局部特征检测和描述,构建运动特征码本。并结合支持向量机对动作基元的码本向量进行分类,从而使用条件随机场模型对得到的动作基元类别序列进行切分和识别,实现了模拟真实场景中,在不同的背景、尺度、视角和光照等条件下的连续行为的切分和识别。   总之,本文在总结现有人体行为识别方法的基础上,进行了简单行为识别和连续行为切分与识别等方面的研究工作,提出了基于熵和直方图相交核的动作特征筛选方法和基于条件随机场的连续行为切分识别模型,实验结果验证了本文所提出方法及模型的有效性。  
其他文献
中医辨证是中医理论的重要一环,是中医诊断疾病、对症下药的最主要的参考依据。然而,传统的中医诊疗过于依赖于医生直观的定性观察,而且辨证过程也以“体验”和“感悟”的人
随着社会经济的飞速发展,公共场所的安全问题面临日益严峻的考验,如何对这些公共场所进行有效地控制和管理,是非常重要的问题。智能监控的出现在一定程度上很好的解决了这一
医学图像的三维重建是采用面绘制或体绘制的成像算法对CT、MRI等图像数据进行处理,从而为医生提供具有真实感的三维立体影像。它能将组织器官内部的层次关系表现出来,呈现出
随着软件技术的快速发展和软件产品的广泛应用,软件测试作为保障软件质量的重要手段越来越受到研究人员的关注。近年来面向对象软件开发技术的广泛应用,带来了信息技术革命的同
随着Web服务标准逐渐被广泛采纳与实现,高度异构的软件系统之间的互操作已经取得了前所未有的进步,面向服务的架构也因其在IT项目中的重要角色而获得广泛的认可,软件作为一种服
医学图像分割是虚拟器官研究工作的重要基础。在虚拟器官研究的工作中,医学图像分割属于前端工作,是医学图像处理进入到医学图像分析的关键步骤,影响着后期的形态建模和物理
随着网络的高速发展,网络中的信息量越来越大,而且质量参差不齐。如何在海量信息中找到满足用户需求的高质量搜索结果变得越来越重要,技术上也更加困难和具有挑战性。目前,搜
赤潮日益成为危害海洋生态环境和人类生产生活的自然灾害。近年我国沿海地区赤潮频发,规模亦呈增长趋势。监控和预测赤潮爆发并及时采取防治措施,利于保护环境,保证渔业生产
内存数据库是一种针对内存的组织和管理的数据库管理系统,它把整个数据库都存储在内存中,具有比传统磁盘数据库更高的实时响应能力,适合用在通信、网上银行、证券交易等实时性高
在医学图像处理技术中,一直以来都存在着一个十分关键的问题,那就是如何正确地提取出我们关心的解剖组织对象也就是我们感兴趣的目标区域,这也正是如何对医学图像进行准确的