论文部分内容阅读
随着计算机和通信技术的迅猛发展,多媒体技术也日新月异,网络娱乐节目的内容形式从由文字和图片为主逐渐向视频过渡。网络提供给人们享受丰富多彩视频节目的同时,也给色情、血腥和暴力等不良视频的传播提供了便利。为青少年营造一个和谐的开放式学习平台成为全社会所关注的焦点问题。目前,不良信息检测技术可以实现对网址、图片和文字等过滤,对视频和音频检测尚不成熟。不良视频检测是一个具有挑战性的课题,涉及到多学科和多领域的知识,对其有效快速的检测成为急需解决的难题。本文研究的典型场景分类和目标检测是不良视频检测中的基础性工作,不良视频通常都是在特定场景下发生的,由不同对象或者不同对象视角等相关镜头组成。场景分类将有助于理解视频内容,使视频内容分析工作更具有针对性。准确的分类便于确定事件发生的场合类型,从而指导调整视频的敏感度。尤其是室内场景,则需要特别关注。目标进出场景检测有助于分析同一场景中各个镜头的有关统计信息之间的关联性。目前,课题组在镜头分割和视频风格分类上取得较好的效果。镜头分割和场景分割是视频分析的基础,镜头分割的准确度将直接影响典型场景分类精度。视频风格分类对视频的整体颜色风格进行判断,便于有针对性的调整肤色模型等。本文重点研究不良视频检测中的几个基础性问题,主要研究内容如下:1、完善多颜色空间视频综合分析平台。平台可以显示打开的视频,通过选择不同的颜色空间分量,实时显示和计算每帧图像的单帧直方图、差分直方图和场均直方图等。场均直方图主要用于场景的分类,场景分类模块可以提取其峰参数特征,实现场景分类。差分直方图主要用于目标检测,目标检测模块可以统计相邻帧或相隔几帧的直方图的差值,设定差值阈值实现目标检测。本平台还可以用于检测镜头切换、视频风格分类和有效颜色分量选择等。2、基于多颜色综合分析平台实现视频典型场景的分类。典型场景往往包含多个镜头,而这些镜头通常会涵盖场景中的各个方面;于是我们提出一种新的直方图,它是由视频场景中所有帧图像的某种颜色直方图累计后获得的,具有非常好的稳定性,基本可以反映该典型场景的独特本质;而不同场景的该直方图,通常存在差异。为了应用方便,对于累计求和之后的直方图进行平均,简称为场均直方图,它可以简便和有效地描述场景。本文对直方图多峰参数提取方法做了改进,利用相关分类规则实现室外场景分类和室内场景的风格描述,并取得了较好的效果。3、基于多颜色空间综合平台和帧间差直方图实现目标检测。视频中的场景往往是缓慢变化的,目标是经常变化的。体现在直方图上,当没有目标进出场景时,相邻两帧图像直方图变化较小,当有目标进出场景时,相邻两帧图像直方图变化显著。利用直方图之间的叠加关系,对视频中背景均匀或变化较小的情况下实现目标进出检测和目标数量的判定,目前,研究比较初步,检测效果还不稳定,下一步将深入分析视频帧间差直方图存在的规律性,提高检测的精度。