论文部分内容阅读
随着计算机网络和数字多媒体技术的发展,互联网视频应用日益普及,网络视频的数量急剧膨胀,如何有效的发现、检索和处理庞大的网络视频数据已成为研究领域和工业界中亟待研究和解决的问题。目前互联网视频检索主要存在的问题包括:(1)检索依赖于网络视频的标题、描述文本等信息,视频信息的索引不完全,文本描述信息不准确,从而影响检索的结果;(2)检索过程中没有充分分析和利用视频的视觉信息,使得检索结果存在视觉内容上的重复,与人们的预期存在偏差;(3)在处理海量网络视频数据时,传统的串行方法在性能上不能满足实用的要求。针对这几个问题,本论文的主要研究工作和创新点如下:1.提出了基于语义结构描述的视频网页识别和信息抽取方法。针对基于文本的视频检索系统,着重研究互联网视频页面的识别方法以及视频网页文本的抽取算法。首先,提出了基于语义区域表示的视频网页描述方法,以语义区域描述视频网页的结构,然后进一步提出面向语义结构的网页匹配算法,并将算法应用于视频页面的识别和视频描述文本的抽取,有效的提高了视频网页内容识别和抽取的准确性,算法的F值度量超过0.85。2.提出了结合SIFT特征匹配及时序特征的视频相似度度量方法。针对传统的视频相似度度量方法存在的准确率不高的问题,本文提出了结合SIFT特征匹配及时序特征的视频相似度度量方法。首先通过SIFT特征进行视频帧的匹配,并通过LSH哈希优化了匹配的效率,提高了匹配的准确率。然后采用RANSAC算法对匹配帧序列进行处理,剔除离群的噪声信息,充分挖掘视频帧之间的相关性,有效地结合了视频帧序列的时序信息,提高了视频相似度度量的准确率,并有效的完成视频片段的相似性检测和消重。在标准数据集的测试中,相似性检测的准确率和召回率均达到90%以上。3.研究了采用仿射传播聚类算法对视频检索结果优化方法。视频的检索结果中通常存在大量的相同或者相似的结果,从而影响检索结果的质量和用户的检索体验。本文针对这一问题提出了基于仿射传播(Affinity Propagation)聚类的视频检索结果优化方法。首先依据视频的相似度模型,计算检索结果中的视频之间的相似度,构造相似度矩阵;然后通过仿射传播聚类算法,依据视频之间的相似度矩阵对视频片段进行聚类,将在内容上相似或者相同的视频进行归类,平均聚类准确率为0.83,有效地改善了视频检索结果的质量,并完成检索结果的优化。4.提出了基于Map/Reduce的分布式海量视频片段相似度计算方法。视频数据的特征复杂使得视频相似度度量算法在处理大规模视频数据时存在性能瓶颈,本文针对这一问题首先提出了一种面向海量视频相似度计算的视频特征表示方法,该方法借鉴了信息论的模型以及文本数据相似度的计算方法。在特征描述的基础上,提出了基于Map/Reduce架构的视频相似度计算方法,将视频片段相似度计算的任务进行分解,并通过分布式的框架进行处理,有效地提高了视频相似度的计算效率,并且具有较高的可扩展性。上述方法已应用于国家863项目“结合语义的视频网站自动发现与分析评估服务”课题中的视频片段聚类与视频相关性检索,并将应用于国家科技支撑计划“支持跨区域、多运营商的新一代广播电视服务系统”的“增强型新闻点播服务”中。