论文部分内容阅读
近年电子产业、多媒体技术和网络技术的飞速发展,使得Web中视频资源——诸如视频点播、数字电视、数字图书馆、视频会议、远程教育等等被越来越多的用户使用。而视频资源具有数据量庞大、复杂的多维结构和内容丰富多样的特点,因此,面对这些海量的而且包含大量非结构化信息的视频数据资源,如何快速地找到所需的视频信息就成为一个急需解决的问题。视频资源的管理和检索技术的研究成为一个热门的课题,各种各样的视频资源检索系统也应需而生。本文通过对视频内容的分析,以视频镜头为基本单位,实现了视频资源的结构化管理,开发了一个基于镜头分类的视频检索系统。本文以实现视频资源自动化管理为目的,遵循基于内容检索的思路,对视频的结构化处理、内容分析以及检索技术进行了较为深入的研究。主要工作和创新点如下:1.通过观察大量的视频资源,从多个角度对常见的镜头语言和镜头运用技巧作了详细的分析,按照本文制定的分类原则,依据不同的分类标准,提出了一种基于内容的视频镜头分类体系,并分析各类镜头的视觉特点。2.在总结现有视频镜头检测方法的特点的基础上,本文提出了一种基于SVM的视频镜头多分类检测策略。通过提取多种有效的视频内容特征参数,利用SVM工具实现多种视频镜头转换方式的分类检测,在实现镜头检测的同时,实现了镜头在转换方式方面的分类。3.在镜头分类方面,通过提取视频镜头的动态特征——光流量分析,实现了视频镜头运动方式的识别,并针对镜头运动方式的不同抽取相应数量的关键帧,做成视频摘要,完成对视频数据的索引;通过提取视频帧的静态特征——颜色特征、边缘特征等,实现了拍摄类镜头、创作类镜头、动画类镜头、演示类镜头的自动分类识别。4.设计并实现了一个基于镜头分类的视频检索系统,建立了视频镜头资源索引库,通过对视频资源的自动分析,完成视频资源的有效索引,取得了较好的实验效果。本文的视频镜头检测实验平台、视频镜头分析系统和基于镜头分类的视频检索系统,基于Windows XP操作系统,以Visual C++6.0为平台,借助DirectSDK软件包开发实现。研究结果表明,对视频资源进行分层次管理,不仅能够实现资源快速有效地检索,而且镜头作为视频的基本物理单元,在视频的语义分析中通常能够提供有效的分析线索,是视频的底层特征与高层语义特征之间建立联系的纽带。本文就是在镜头层面上建立起一个各领域通用的视频资源检索系统,适用于各类摄像专业人士或爱好者对视频资料中的特定类型的镜头进行查询、浏览和管理,能够迅速准确地向查询者展现某一种特定镜头的特点。即可用于教学,也可供创作人员参考。另外,针对不同类型镜头的特点,可以总结出某些类型视频的特点,进而实现不同类型视频的自动分类,建立底层特征与高层语义的联系。