基于人脸对象的简单人脸视频静态摘要的研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:tianxiang521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统静态视频摘要方法主要根据相邻帧之间的差异来提取视频关键帧,本文着重于对视频中的人脸对象进行分析并提取视频关键帧集合。由于视频中检测到的人脸图片数量较多且存在一定的冗余,常规的人脸特征维数又较高,从而大大影响生成视频摘要的精度和速度,为此,提出了一种针对face-track的特征描述方法,其中的face-track是指跟踪视频中的单个人脸而得到的图片集合;本文提出的face-track特征描述法通过对face-track的人脸图片集合进行特征空间变换,分析提取其中有效的信息,从而得到对于face-track的整体描述而非单张人脸的特征描述。使得视频中的人脸特征不仅在数量上而且在维度上都得到了有效压缩。实验比较了不同的特征提取方法,并采用不同的聚类算法进行了效果验证,结果表明本文提出的face-track特征描述方法在聚类时间上和准确度上都有一定的优势。通过聚类算法从视频中获得关键帧,从而生成静态摘要,是一种常见的视频摘要生成方法,然而常见的聚类算法不仅需要预先确定类的个数,而且忽略了视频帧的时间顺序,导致得到的视频摘要不能准确概括视频中的重要内容。稀疏子空间聚类是一个新颖的聚类方法,该方法不需要预先制定聚类个数,本文在原有的稀疏子空间聚类的基础上,提出了基于人脸序列的稀疏子空间聚类算法,并给出了一个新颖的视频摘要生成系统。该系统不同于常规的侧重于分析整个视频帧内容的视频摘要生成方法,而是侧重于分析视频帧中的人脸对象,通过检测跟踪视频中的人脸,得到若干人脸序列,然后通过对这些人脸序列进行稀疏子空间聚类,将整个视频按照视频中出现的重要人物进行概括,当用户选中某个人时,系统则给出该人物在整个视频中的关键帧,不仅可以方便用户快速浏览视频内容,查看感兴趣人物的活动轨迹,而且可以缩短大规模视频库的检索时间。实验比较了跟本文方法接近的聚类算法以及视频摘要生成方法,结果表明本文方法可以得到较为满意的静态视频摘要。
其他文献
目前国内外对于毫米波传输线的研究点还存在一些问题,主要表现在以下几个方面:(1)研究的频率都不是很高,大部分都低于40GHz。(2)研究的结构很单一,局限于微带线和共面波导等
近年来随着个人通信业务的蓬勃发展,各种功能强大的多媒体终端得到广泛应用,软件开发者在终端平台上开发出各种有趣的互联网应用。为了使用户能够随时随地方便地接入互联网使
无线通信系统可用无线频谱资源的稀缺性与无线通信对频谱资源不断增长的需求量之间的矛盾正在日益激化着,因而频谱资源将会成为未来无线通信系统设计时首要考虑的因素。而异
随着嵌入式技术的发展,嵌入式平台在各个行业发挥着越来越重要的作用。智慧城市、平安城市及人工智能高速发展,使得人脸识别技术结合嵌入式平台已经逐步应用在智能安防、智能
时代在进步,作为现代工业技术支柱之一的液压传动技术也在发展。随着全球资源的进一步枯竭,液压系统的节能问题越来越成为减少环境资源的浪费、达到节能目的的关键问题之一。
近年来,随着无线通信技术的运用越来越广泛,人们对于实现单终端多功能无线通信也有了更深入的需求。对于移动终端设备,需要支持TD-LTE、TD-SCDMA等多种标准,这些标准使用的通
流量发生器[1]是为SDN网络试验床[2]CENI系统[3]提供实验背景流量[4]的重要工具,实验研究人员可以在CENI系统中进行相关网络实验,随着CENI系统的发展,越来越多的实验研究人员
近年来基于移动设备的眼动跟踪技术逐渐成为一个研究热点,并得到了迅速发展和应用推广。但是由于受到移动设备软硬件性能的限制,眼动跟踪精度和效率较低,通常还需要外部硬件
关注青年成长,关注青年教育,关注青年未来,是中国共产党一直以来的优良传统。党的十八大以来,以习近平同志为核心的党中央高度重视青年教育事业,习近平总书记结合当前国内外形势变化,针对当下青年教育面临的新问题、新要求、新挑战,在一系列重要讲话、座谈、指示等不同场合多次提及青年教育这一重大问题,形成了一系列具有长远战略高度、历史深度、全球广度的关于青年教育的重要论述,习近平总书记关于青年教育的重要论述是新
在三网融合的背景下,基于中国移动多媒体广播网络(China Mobile Multimedia Broadcasting,CMMB),中国卫星通信集团有限公司(中国卫通)开始了L波段CMMB信号无线局域网(Wireles