基于多核支持向量机的视频人物自动标注的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:s5df45sd6546f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和计算机网络技术的发展,人们接触到的视频数据以前所未有的速度增长。然而,现有的视频信息处理技术大多数是非智能的操作,远远不能满足海量且内容丰富的视频信息访问和管理的需求,大量的信息不能被有效的利用。从用户的角度分析,他们希望在任何时间任何地方以任意的方式享受视频媒体。与文本、语音等信息的相比,视频中含有大量各种各样的、复杂的有用信息,其内容更加丰富、直观和生动。视频中包括的主要应用包括:人物识别。确定谁在屏幕中出现;动作、物体识别和表情估计,判断视频中的人物在做什么和这个物体是什么;场景理解,判断某个地方发生了什么事情;语义理解、内容分析。  本文首先概要介绍了视频人脸特征定位与人脸描述符提取,分析了基于局部特征提取人脸描述符的优缺点,结合基于全局人脸描述符的特点,提出了一种新的综合的人脸描述符特征。分析提取视频中人物衣服特征的缺点,引入新的头发特征。对最近邻分类器和支持向量机分类器进行分析对比,提出了一种基于多核支持向量机的分类算法。本文的研究内容及主要工作包括以下几个方面:  为进一步提高分类的准确率,去除原有的衣服颜色特征,新引入头发颜色特征作为多核分类器的一个基本核。  (2)研究人脸的全局特征与局部特征相互结合后对分类效果的影响。并进行相应的实验比较。  (3)对现有的人脸序列的分类算法优进行了分析,并新引入多核支持向量机分类器,进行实验比较。
其他文献
电子病历是医疗机构对门诊、住院患者(或保健对象)临床诊疗和指导干预的、数字化的医疗服务工作记录,是居民个人在医疗机构历次就诊过程中被完整记录的、详细的临床信息资源
自然场景仿真是计算机图形学的一个重要研究领域,植物是自然场景中的重要组成部分,在虚拟现实、计算机动画、三维视频游戏、数字娱乐、影视特效、军事仿真等方面有着重要应用
互联网信息资源的快速膨胀推动了搜索引擎技术的蓬勃发展,作为一种网上信息检索工具,搜索引擎能够帮助用户从杂乱的信息中抽出一条清晰地检索路径,快速准确的定位到所需信息
随着软件技术的发展,Web应用已经变得越来越庞大和复杂,Web页面也以指数级增长,而开发周期却越来越短、维护更新也更为频繁,这就导致目前实际开发中Web页面常用的单元测试方
本文主要总结了如何用公式表示达尔文进化动力学的相关工作。尽管人们一直认为在生物学中存在通用的数学定律,但是反对这个观点的意见大量存在于学术界。基于近年来在数学和
近年来,研究者越来越重视通过应用数据挖掘技术在海量数据中发现知识和规则。在数据挖掘过程中,数据可视化技术是保证挖掘结果便于用户理解数据和进行交互的重要途经,因此数
基于Web的信息系统通过Internet来为用户或其它系统提供信息服务,随着Web技术的不断发展,这类系统越来越普遍。学习和研究Web信息系统的开发方法,在当前具有重要的现实意义,
在信息技术领域,云计算作为目前最热门的话题之一为现代高速计算提供了新思路,即采用了一种新型的基于因特网的计算模型实现了高速计算。但目前云计算中的安全问题日益突出,
社会容迟网是具有一定社会关系的人所形成的具有社会性的容迟网络,所以研究社会容迟网的路由方法需要充分考虑到网络中节点的社会性和容迟网络的特性。节点的社会性主要体现
近年来,由于访问控制系统的发展和应用环境要求的提高,现有的访问控制模型已经不能满足访问控制的需要,特别是对于有动态应用要求的系统,传统的访问控制模型实现起来比较复杂