基于多颜色空间和统计直方图的场景分类和目标检测研究

来源 :济南大学 | 被引量 : 19次 | 上传用户：xjtu_kendy

【摘要】

：

随着计算机和通信技术的迅猛发展,多媒体技术也日新月异,网络娱乐节目的内容形式从由文字和图片为主逐渐向视频过渡。网络提供给人们享受丰富多彩视频节目的同时,也给色情、

【作者】

：

刘林

【机构】

：

济南大学

【出处】

：

济南大学

【发表日期】

：

2011年01期

【关键词】

：

多颜色空间场均直方图帧间差直方图典型场景分类目标检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机和通信技术的迅猛发展,多媒体技术也日新月异,网络娱乐节目的内容形式从由文字和图片为主逐渐向视频过渡。网络提供给人们享受丰富多彩视频节目的同时,也给色情、血腥和暴力等不良视频的传播提供了便利。为青少年营造一个和谐的开放式学习平台成为全社会所关注的焦点问题。目前,不良信息检测技术可以实现对网址、图片和文字等过滤,对视频和音频检测尚不成熟。不良视频检测是一个具有挑战性的课题,涉及到多学科和多领域的知识,对其有效快速的检测成为急需解决的难题。本文研究的典型场景分类和目标检测是不良视频检测中的基础性工作,不良视频通常都是在特定场景下发生的,由不同对象或者不同对象视角等相关镜头组成。场景分类将有助于理解视频内容,使视频内容分析工作更具有针对性。准确的分类便于确定事件发生的场合类型,从而指导调整视频的敏感度。尤其是室内场景,则需要特别关注。目标进出场景检测有助于分析同一场景中各个镜头的有关统计信息之间的关联性。目前,课题组在镜头分割和视频风格分类上取得较好的效果。镜头分割和场景分割是视频分析的基础,镜头分割的准确度将直接影响典型场景分类精度。视频风格分类对视频的整体颜色风格进行判断,便于有针对性的调整肤色模型等。本文重点研究不良视频检测中的几个基础性问题,主要研究内容如下:1、完善多颜色空间视频综合分析平台。平台可以显示打开的视频,通过选择不同的颜色空间分量,实时显示和计算每帧图像的单帧直方图、差分直方图和场均直方图等。场均直方图主要用于场景的分类,场景分类模块可以提取其峰参数特征,实现场景分类。差分直方图主要用于目标检测,目标检测模块可以统计相邻帧或相隔几帧的直方图的差值,设定差值阈值实现目标检测。本平台还可以用于检测镜头切换、视频风格分类和有效颜色分量选择等。2、基于多颜色综合分析平台实现视频典型场景的分类。典型场景往往包含多个镜头,而这些镜头通常会涵盖场景中的各个方面;于是我们提出一种新的直方图,它是由视频场景中所有帧图像的某种颜色直方图累计后获得的,具有非常好的稳定性,基本可以反映该典型场景的独特本质;而不同场景的该直方图,通常存在差异。为了应用方便,对于累计求和之后的直方图进行平均,简称为场均直方图,它可以简便和有效地描述场景。本文对直方图多峰参数提取方法做了改进,利用相关分类规则实现室外场景分类和室内场景的风格描述,并取得了较好的效果。3、基于多颜色空间综合平台和帧间差直方图实现目标检测。视频中的场景往往是缓慢变化的,目标是经常变化的。体现在直方图上,当没有目标进出场景时,相邻两帧图像直方图变化较小,当有目标进出场景时,相邻两帧图像直方图变化显著。利用直方图之间的叠加关系,对视频中背景均匀或变化较小的情况下实现目标进出检测和目标数量的判定,目前,研究比较初步,检测效果还不稳定,下一步将深入分析视频帧间差直方图存在的规律性,提高检测的精度。

其他文献

上下文感知的实体链接技术研究

将互联网上海量的非结构化文本数据转为应用所需的结构化知识,使其可被计算机高效地利用是改进搜索系统,实现智能问答与机器阅读的基础。在这个过程中,实体链接技术扮演了一

学位

实体链接文档向量信息抽取分布式表达

数据发布中数值型敏感属性的隐私保护研究

近年来,学术界针对数据发布中的隐私保护问题已经提出了许多模型和算法,这些模型和算法在不同程度上解决了数据发布中的隐私泄露问题。但是,现有的模型和算法主要是针对分类

学位

隐私保护数值型敏感属性近邻泄露(εpl)-anonymity模型α相似性隐私保护模型

面向图像表达的非负局部坐标分解算法

目前在计算机视觉和模式识别领域内,非负矩阵分解(NMF)越来越多得被用作特征提取。NMF寻找两个小的非负矩阵,使得它们的乘积能够最好的拟合原始矩阵。而非负的这个限制导致了

学位

非负矩阵分解局部坐标稀疏编码

无线传感器网络路由技术的研究

无线传感器网络是由在监测区域内部署的大量多功能、低能耗、廉价的微型传感器节点组成的智能专用网络。由于具有部署灵活、扩展方便、价格低廉等优点，无线传感器网络在工业、

学位

无线传感器网络路由协议服务质量LEACHDD

基于分散隐藏策略的高容量FPGA芯核水印算法研究

数字水印技术在图像、视频和文本等多媒体载体上的应用已经成熟，但在嵌入式系统、集成电路设计等领域的知识产权保护仍处于探索阶段。考虑到设计和开发一个新的FPGA芯核电路需

学位

数字水印分散隐藏策略FPGA压缩机制芯核水印

基于改进哈希算法的快速KNN文本分类方法

网络的日益普及和人们对技术的日益依赖,使得数据越来越多的以电子的形式存储在计算机中。在当今高节奏社会,无论是在大型的企业数据中,还是在网络上,如何迅速有效的找到所需

学位

文本分类KNN特征加权词性标注提示词

Web服务QoS灰色定量评估模型研究

面向服务的体系架构(Service Oriented Architecture,SOA)的提出，使软件开发从传统的面向对象方式向面向服务方式转变。作为可以在组织内部的异构计算资源中被共享、组合和复

学位

Web服务Web服务QoS评价灰色系统理论灰色评价模式

基于总剩余最大化和物品上下文约束的协同推荐算法研究

电子商务中产生越来越多的产品和交易信息,使得用户快速找到自己想要的产品变得越来越困难。同时,电子商务企业也面临着如何推荐让用户满意的产品从而提高销售量的问题。电子

学位

电子商务推荐系统协同过滤总剩余最大化上下文约束

基于注意力机制的图像显著区域提取算法分析与比较

基于生物感知的图像显著特征分析在二十世纪九十年代末兴起,并逐渐成为生物视觉感知领域研究的焦点。该方法结合人类心理学和生理学理论知识,基于人类视觉注意机制,模拟人眼

学位

视觉感知显著图显著区域算法评测

行人识别中的模板选择与特征提取

本文是以步态识别为应用背景,主要探讨了步态识别中的模板选择和模板上的特征提取问题。步态识别经历多年的发展,逐渐形成了基于模型和无模型两种基本稳定的框架,基于模型的

学位

步态识别模板选择特征提取

基于多颜色空间和统计直方图的场景分类和目标检测研究

与本文相关的学术论文