论文部分内容阅读
摘 要:在媒体行业不断发展的今天,视频作为重要的媒体表现形式发展迅猛。面对网络上大量的视频,如何能够筛选有效的视频已经成为一大难题。视频结构化就是解决这个难题的重要途径。本文阐述了视频结构化的定义,分析了视频结构化提出的原因,对于结构化技术进行介绍,分析了视频结构化的难点。
关键词:视频结构化内容分析;镜头边界检测;场景检测
1.视频结构化
很多人对于视频结构化是不甚了解的,视频结构化通俗讲,就是对于视频数据的结构化处理,并且能够对于视频进行智能化处理,能够在视频中提取出关键的信息,并且能够对其进行语言文字叙述。在视频中提取的关键信息主要有三大类:第一类,是对运动目标的识别,就是对视频画面中的运动对象进行识别,包括车辆和人;第二类,就是对于所提取目标对象进行特征提取,也就是对与视频画面中的车辆的外形、颜色、车牌号以及车型进行提取,还有就是对于人的身高、体型、衣服、性别等基本特征进行提取;第三类,便是对于目标对象运动轨迹进行分析,具体包括在哪里有所徘徊,在哪里拐弯,并且能够对于目标对象行踪进行大概判断等等。
视频结构化主要包括以下4个步骤:(1)对背景建立模型,并且能够将目标背景进行分离;(2)对于目标对象进行跟踪,和对目标对象进行分类;(3)提取视频画面中目标对象的基本特征,包括人、车辆或者是物品的特征;(4)对于事件进行检测,并且能够进行大致的描述,这里描述的如果是人物,应当包括人脸、着装、细节、身高、年龄范围、性别等;如果是对于车辆的描述,应当包括车牌,车身颜色,车类型,品牌、子品牌,车贴,车饰物品等;视频结构化模型主要就包括以上几个内容,通过视频结构化,能够快速的提取出有效信息。
2.视频结构化的必要性
视频记录的信息在内容和形式上具有直观、真实等自身特点,已经成为了十分受关注的媒体。视频主要包括图像和音频信号,图像主要记录的是视频对象的形状、颜色以及状态,还可以后期添加文字、图片、字幕等等;音频信号主要记录了视频对象所发出的声音的音色、响度、语言以及背景,后期同样也可添加音乐或是音效。这些都使视频在数字化平台上无结构泛滥,无结构就是指用户难以查找到自己想要的视频,人们最初的检索方式就是,先找到文件源,然后逐条检索,最后找到自己想要的文件;随着时代的进步,人们用文字对视频进行描述,然后检索文字便可以检索到视频,然而这种方法耗费大量的人力去标记视频,不再适用于现如今的大量视频,因此视频结构化是十分必要的。
3.视频结构化研究现状
1993年张宏江在ACM《多媒体系统杂志》期刊上发表关于视频结构化的第一篇文章,这篇文章为现代视频检索和内容查询建立了一个基本框架。下面简述了相关技术的研究现状。
3.1视频镜头探测
我们把视频按照时间的顺序划分成一个个结构单元,这个结构单元就是帧。镜头探测最初就是分析相连结构单元的颜色变化来探测镜头。人们把视频帧分成一个一个小块,计算各个分块之间的距离来探测镜头,这样能够提高对噪声和对象运动的鲁棒性。目前,视频镜头探测已经有很大进步,尤其是在对于突变镜头已经有很高的准确性。但是在渐变等方面的探测准确性有待提高。
3.2语义标注
在之前的视频检索,传统的检索方法就是对图像颜色、形状、等特征进行检索,但是这种方法已经不能够满足现代人对于视频搜索的需求。因此,出现了将视频和音频中的方法引入到视频结构化中,这样便能在更高的水平实现视频搜索。还有,随着科学技术的进步,由于在视频中穿插了大量字幕,因此,也随之出现了字幕探测等方法。
3.3视频音轨分析
音轨是视频重要的组成之一,有了音频,对于是视频的理解更容易。在不同的情境下,会有不同的音轨,根据这些音频的停顿、音乐、音响可以判断视频情境。因而,人们可以将视频的音频进行分段和标注,以此完成视频结构化。
4.视频结构化技术应用范围
4.1视频结构化应用于公安行业,能够在众多海量视频信息中为公安部门提供有效的信息。在视频内容信息处理上,公安机关能够用视频结构化,全方面实现实时视频监控,并且与互联网相互作用,能够将可以信息进行探测,并且做到及时反馈和储存,将这些获取的信息转化为公安工作中的有用情报。通過结构化视频能够实现自动监控、自动联网、自动报警等网络功能,能够实现民警随时随地灵活、简单、多样进行治安管理,随时探测到违法乱纪行为。
4.2视频结构化技术的应用于交通行业。在各个电警卡口图侦上的应用需求和频率早就超越了交警的工作范围,因为大多数的案件都与交通有着必不可少的联系,车辆是主要的交通作案工具。因此,对于各个路口对于特别车辆进行辨别显得尤为重要,而此时,最好的获取信息途径便是对于监控视频的探测。这种卡口电警对于道路的安全有着重要作用。目前,在我国一些厂家加大对于这方面的投入,能够精准抓拍特征车辆或者人的特征信息,能够更好的保障人民生活。
5.对视频结构化提出几点建议
5.1研究关键技术,突破应用难题。
对于一项技术的考验,便是将其应用于实际。因此,研究该领域的业务部门,要加强对于核心技术的研究,建立监控视频结构化模型,对于在视频分割、内容提取、内容描述等方面的关键技术要迎难而上,争取能够将其成功应用于市场。
5.2加强顶层设计,同步构建标准体系。
成熟的技术首要实现的便是标准化。通过对于视频结构化技术的研究,能够建立视频结构化应用模型,并且能够制定规范的技术研究和设备开发,能够制定视频结构化应用标准,在技术的源头上做到视频结构化应用的标准化。
5.3有序开展视频信息系统平台,推进信息资源的整合应用。
开展关于视频结构化应用模式的研究,能够制定出应用系统以及解决方案,针对典型应用环境,建设应用示范系统。如通过视频结构化技术提取出的信息,可与网络之间进行信息整合,能够更好的应用到公安和交警部门。
总结语
在科学技术不断发展的今天,视频结构化应用有助于公安部门对于社会治安监控的风险进行评估,同时也能够在提取出的信息进行分析判断,能够找到快速地找出有用的证据和线索,能够解决在公共安全中的重要问题。
参考文献
[1]明巍;基于内容的视频检索中关键帧提取算法研究[D];武汉工业学院;2010年
[2]段豪;视频检索技术中关键帧提取算法的研究[D];太原理工大学;2012年
[3]韩冠;基于多媒体的在线协作学习系统[D];西安电子科技大学;2012年
(作者单位:新疆维吾尔自治区产品质量监督检验研究院)
关键词:视频结构化内容分析;镜头边界检测;场景检测
1.视频结构化
很多人对于视频结构化是不甚了解的,视频结构化通俗讲,就是对于视频数据的结构化处理,并且能够对于视频进行智能化处理,能够在视频中提取出关键的信息,并且能够对其进行语言文字叙述。在视频中提取的关键信息主要有三大类:第一类,是对运动目标的识别,就是对视频画面中的运动对象进行识别,包括车辆和人;第二类,就是对于所提取目标对象进行特征提取,也就是对与视频画面中的车辆的外形、颜色、车牌号以及车型进行提取,还有就是对于人的身高、体型、衣服、性别等基本特征进行提取;第三类,便是对于目标对象运动轨迹进行分析,具体包括在哪里有所徘徊,在哪里拐弯,并且能够对于目标对象行踪进行大概判断等等。
视频结构化主要包括以下4个步骤:(1)对背景建立模型,并且能够将目标背景进行分离;(2)对于目标对象进行跟踪,和对目标对象进行分类;(3)提取视频画面中目标对象的基本特征,包括人、车辆或者是物品的特征;(4)对于事件进行检测,并且能够进行大致的描述,这里描述的如果是人物,应当包括人脸、着装、细节、身高、年龄范围、性别等;如果是对于车辆的描述,应当包括车牌,车身颜色,车类型,品牌、子品牌,车贴,车饰物品等;视频结构化模型主要就包括以上几个内容,通过视频结构化,能够快速的提取出有效信息。
2.视频结构化的必要性
视频记录的信息在内容和形式上具有直观、真实等自身特点,已经成为了十分受关注的媒体。视频主要包括图像和音频信号,图像主要记录的是视频对象的形状、颜色以及状态,还可以后期添加文字、图片、字幕等等;音频信号主要记录了视频对象所发出的声音的音色、响度、语言以及背景,后期同样也可添加音乐或是音效。这些都使视频在数字化平台上无结构泛滥,无结构就是指用户难以查找到自己想要的视频,人们最初的检索方式就是,先找到文件源,然后逐条检索,最后找到自己想要的文件;随着时代的进步,人们用文字对视频进行描述,然后检索文字便可以检索到视频,然而这种方法耗费大量的人力去标记视频,不再适用于现如今的大量视频,因此视频结构化是十分必要的。
3.视频结构化研究现状
1993年张宏江在ACM《多媒体系统杂志》期刊上发表关于视频结构化的第一篇文章,这篇文章为现代视频检索和内容查询建立了一个基本框架。下面简述了相关技术的研究现状。
3.1视频镜头探测
我们把视频按照时间的顺序划分成一个个结构单元,这个结构单元就是帧。镜头探测最初就是分析相连结构单元的颜色变化来探测镜头。人们把视频帧分成一个一个小块,计算各个分块之间的距离来探测镜头,这样能够提高对噪声和对象运动的鲁棒性。目前,视频镜头探测已经有很大进步,尤其是在对于突变镜头已经有很高的准确性。但是在渐变等方面的探测准确性有待提高。
3.2语义标注
在之前的视频检索,传统的检索方法就是对图像颜色、形状、等特征进行检索,但是这种方法已经不能够满足现代人对于视频搜索的需求。因此,出现了将视频和音频中的方法引入到视频结构化中,这样便能在更高的水平实现视频搜索。还有,随着科学技术的进步,由于在视频中穿插了大量字幕,因此,也随之出现了字幕探测等方法。
3.3视频音轨分析
音轨是视频重要的组成之一,有了音频,对于是视频的理解更容易。在不同的情境下,会有不同的音轨,根据这些音频的停顿、音乐、音响可以判断视频情境。因而,人们可以将视频的音频进行分段和标注,以此完成视频结构化。
4.视频结构化技术应用范围
4.1视频结构化应用于公安行业,能够在众多海量视频信息中为公安部门提供有效的信息。在视频内容信息处理上,公安机关能够用视频结构化,全方面实现实时视频监控,并且与互联网相互作用,能够将可以信息进行探测,并且做到及时反馈和储存,将这些获取的信息转化为公安工作中的有用情报。通過结构化视频能够实现自动监控、自动联网、自动报警等网络功能,能够实现民警随时随地灵活、简单、多样进行治安管理,随时探测到违法乱纪行为。
4.2视频结构化技术的应用于交通行业。在各个电警卡口图侦上的应用需求和频率早就超越了交警的工作范围,因为大多数的案件都与交通有着必不可少的联系,车辆是主要的交通作案工具。因此,对于各个路口对于特别车辆进行辨别显得尤为重要,而此时,最好的获取信息途径便是对于监控视频的探测。这种卡口电警对于道路的安全有着重要作用。目前,在我国一些厂家加大对于这方面的投入,能够精准抓拍特征车辆或者人的特征信息,能够更好的保障人民生活。
5.对视频结构化提出几点建议
5.1研究关键技术,突破应用难题。
对于一项技术的考验,便是将其应用于实际。因此,研究该领域的业务部门,要加强对于核心技术的研究,建立监控视频结构化模型,对于在视频分割、内容提取、内容描述等方面的关键技术要迎难而上,争取能够将其成功应用于市场。
5.2加强顶层设计,同步构建标准体系。
成熟的技术首要实现的便是标准化。通过对于视频结构化技术的研究,能够建立视频结构化应用模型,并且能够制定规范的技术研究和设备开发,能够制定视频结构化应用标准,在技术的源头上做到视频结构化应用的标准化。
5.3有序开展视频信息系统平台,推进信息资源的整合应用。
开展关于视频结构化应用模式的研究,能够制定出应用系统以及解决方案,针对典型应用环境,建设应用示范系统。如通过视频结构化技术提取出的信息,可与网络之间进行信息整合,能够更好的应用到公安和交警部门。
总结语
在科学技术不断发展的今天,视频结构化应用有助于公安部门对于社会治安监控的风险进行评估,同时也能够在提取出的信息进行分析判断,能够找到快速地找出有用的证据和线索,能够解决在公共安全中的重要问题。
参考文献
[1]明巍;基于内容的视频检索中关键帧提取算法研究[D];武汉工业学院;2010年
[2]段豪;视频检索技术中关键帧提取算法的研究[D];太原理工大学;2012年
[3]韩冠;基于多媒体的在线协作学习系统[D];西安电子科技大学;2012年
(作者单位:新疆维吾尔自治区产品质量监督检验研究院)