基于金字塔匹配的视频检索关键技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:gaoxiaoyu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上视频数据的海量增长,对视频数据的组织和管理成为当下的迫切需求。由于传统的基于属性和文本的视频检索存在许多不足之处,因此直接通过视频的内容特征为索引的视频检索成为了当前研究中的一个热点,其中特征提取和特征的相似性度量是其关键技术。它可以结合文本检索技术实现更加准确的视频分类和索引,可以剔除文本检索视频中出现的重复视频,还能够解决网站视频版权的维护和界定等问题。但由于目前视频的底层特征与用户理解之间存在“语义鸿沟”问题,现有基于内容的视频检索系统的检索结果往往精度不够高,不能很好地满足用户的检索需求。   本文在基于金字塔匹配的视频检索框架下,对视频的特征提取和金字塔系列相似性度量算法做了研究。首先,为了选择鲁棒的特征进行视频检索,对多种视频特征做了比较和分析,为了充分利用视频的时空信息,在传统特征提取算法的基础上,提出一种镜头高层特征提取算法,算法对视频镜头中频繁出现的时间稳定区域进行跟踪,构造一个区域关系图,并利用图的连通性和区域节点的属性选取出信息量较大的区域节点作为镜头的表示,然后代表镜头的区域中提取多类基础特征的统计作为镜头特征,该算法提取的特征可以为视频镜头的自动分类服务。同时,研究了“视觉词包模型”下的金字塔匹配算法,针对金字塔匹配算法中,特征编码使用矢量量化方法表示不够精确的问题,将生物学视觉感知中的重要研究成果稀疏编码方法融入了该方法中,使得匹配结果更加符合人眼的视觉感知判断,从而提高检索的精度。最后,在基于金字塔匹配的视频检索框架下,融合了镜头分割、特征提取、密码本训练、特征编码、相似性度量等模块,对整个检索系统进行了仿真实验。   经过仿真实验表明:本文提出的融合传统特征提取算法和视频时空信息的高层镜头特征提取算法取得了较好的视频分类效果;而稠密sift特征相比颜色、纹理、边缘等特征更为鲁棒,适合作为视频检索的索引特征,运用于金字塔匹配视频检索系统中,融合稀疏编码方法可以更有效的提高检索的精度和效率。  
其他文献
据2013年互联网数据中心报告显示,预计到2020年全球的数据总量将超过40ZB,这一数据量是2011年的22倍,如何从海量数据中快速抽取出用户所需要的信息是一个重要的研究课题。关
语音信号是人们构成思想疏通和感情交流的最主要的途径。传统的语音处理系统大多只着眼于语音词汇传达的准确性,而忽略了包含在语音信号中的情感信息。让计算机能够像人一样说
在数据挖掘、传感器网络、数据检索等应用中产生了大量的不确定性数据,它广泛地存在于金融、军事等领域中。不确定性数据带给用户的信息是不准确的,但是如果直接丢弃或者清洗
复杂背景视频序列中微动目标的特征提取与分类算法研究,在运动目标的检测与提取的研究领域中,有着十分重要的地位。在对该领域的研究中,已有的算法大多是基于运动特征或能量等对
随着智能规划越来越多在实际问题中的应用,更多的学者开始关注和研究智能规划,人们从多个角度去完善,并提出了多种规划策略,其中,启发式规划方法作为智能规划领域的重要问题之一,在
云计算技术的飞速发展推动了信息化架构的大整合,但将高性能计算迁移到云服务上,仍面临着重重挑战。尤其是目前广泛用于海量数据处理的Hadoop体系,应用到科学计算的某些领域存在
随着人脸识别技术在模式识别、计算机视觉和多媒体技术等领域中的不断发展,人脸检测与跟踪作为人脸识别技术中的关键问题,越来越受到大量相关研究者的关注与重视。目前,人脸检测
云是大气中热力过程和动力过程的外部表现,同时也是水汽循环的重要环节。它在天空中表现出来的水汽状况、稳定程度以及高度和厚度,都是实时预测天气的关键性特征。因而对于人
随着传感器技术、无线通信技术以及嵌入式计算技术的飞速发展和日益成熟,无线传感器网络在军事、环境、家居、医疗等诸多领域得到了广泛的应用。无线传感器网络一般是由大量采
近年来,随着计算机网络的普及和应用,网络成为全球范围内信息转播主要渠道,为用户提供方便的网络接入服务已成为各个公共场所的常用服务之一,所以越来越多的场合需要用到网络审计