基于数据挖掘的视频镜头分类技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:tedious
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的飞速发展,产生了海量的视频数据。为了使用户能够快速准确地检索到感兴趣的视频信息,需要对这些数据进行有效地组织、管理和分析。其中,通过视频分类技术对视频数据进行语义类别的整理分类,能够缩小检索范围,提高检索速度。 视频分类可以分为基于关键词的视频分类和基于内容的视频分类。通过人工标注的关键词对视频进行分类,不仅受入主观因素的影响,标注的关键词主观性强,而且随着日益增长的视频数据量,人工标注费时费力。基于内容的视频分类根据视频的视觉、音频等内容对视频进行自动分类,由于视觉、音频特征客观地描述了视频的真实内容,因此克服了基于关键词分类产生的问题。 目前视频内容分析技术主要是利用视频低层特征描述其内容,与人们对视频语义内容的理解存在很大差异,因此基于内容的视频分类存在的问题是视频低层特征和高级语义概念之间的语义鸿沟。本文在分析现有基于内容的视频分类算法的基础上,采用数据挖掘技术,对基于内容的视频分类若干关键技术进行了研究,力图挖掘视频的类别语义信息,以克服现有的语义鸿沟问题。本文主要工作包括:视频镜头边缘检测和关键帧提取、视频特征提取和视频镜头分类等。具体内容包括以下几个方面: (1)视频镜头分割部分,提出了一种基于因果的自适应双阈值镜头边界检测算法,并对突变检测和渐变检测方法进行了改进,取得了较好的检测效果,最后在镜头分割的基础上进行了关键帧提取; (2)通过分析卡通、新闻、电影、篮球和足球五类视频在视觉特征上的差异,完成了基于关键帧和镜头的颜色和运动视觉特征的提取,并对特征数据进行整理,实现了一套视频镜头描述方案,取得了较好的视频镜头内容表达效果; (3)在视觉特征提取和视频镜头描述基础上,采用Microsoft决策树分类算法构建视频镜头分类模型,对视频镜头进行高级语义的视频类型分类,取得了较好的分类性能。 本文所提的视频分类方法可以进一步推广到视频检索、视频内容过滤、智能化电视等各种应用中,并会推动新的视频应用的发展。
其他文献
在雷达、水声、通信等领域,对线性调频信号(Linear Frequency Modulation,LFM)参数的估计测量十分普遍,本文结合项目背景,在TMS320C6678硬件平台上工程化实现了LFM信号参数的
随着社会信息化步伐日益加快和网络技术的飞速发展,人们的沟通方式也随之发生改变,通过网络与他人进行交流的方式日益取代了书信的方式,网络文本数据的数量日益增加。因此对
多输入多输出(MIMO)技术能够显著提高无线信道的频谱效率,正交频分复用(OFDM)技术能够有效对抗宽带信道多径时延扩展造成的频率选择性衰落。两者联合的MIMO-OFDM技术,以其高
无线Mesh网络(Wireless Mesh Network,WMN)是一种新型的宽带无线网络结构,可以看成是无线局域网(Wireless Local Area Network,WLAN)和移动Ad-hoc网络(Mobile Ad hoc Network
随着新一轮的电信重组,电信运营商向全业务运营模式转变和发展,伴随着网络运维工作将面临三个转变:即业务上从面向设备向面向业务转变,技术上从电路交换向IP交换转变,管理上网
随着现代通信技术和移动互联网的不断发展,移动设备(如智能手机、平板电脑、车载终端等)在现代人们的生活中得到了广泛的普及,移动设备上的移动应用也越来越丰富,如人脸识别,
MIMO技术被普遍认为是新一代移动通信系统必须采用的关键技术之一。该技术能在不增加带宽和发射功率的情况下有效地提高通信系统的容量和频谱利用率,同时也可以提高系统的可
滑聚合成孔径雷达(Sliding Spotlight Synthetic Aperture Radar,Sliding Spotlight SAR)能综合条带(Stripmap)SAR方位向大测绘带和聚束(Spotlight)SAR高分辨使其在SAR测绘监
信号表示信号处理的重要基础。不同的信号表示方法能够反映信号不同的特征信息,产生不同的信号分析方法。信号检测是信号处理中的基本问题,依据信号的特征将其与噪声进行区分
低噪声放大器(Low Noise Amplifier,LNA)是微波系统及其测量仪器中的关键部件之一,其噪声的大小直接影响信号接收灵敏度及系统的可靠性。研制低噪声放大器对降低发射机和接收机