基于场景分析的监控视频编转码研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:happykaijie1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着平安城市、畅通城市等交通、安防需求的迅猛增长,视频监控系统得到了广泛的应用,从而引发了监控视频的数据量呈指数级爆炸式增长。监控视频是“体量”最大的大数据(Big Data)。据IDC测算,2010年“大数据”中50%是监控视频;到2015年此比例会增长到65%;到2020年监控视频仍占44%。按照每10年视频压缩效率提升1倍的“摩尔定律”计算,显然监控视频数据量的增长速度已经远远超过视频压缩效率的提升速度。因此,面对海量的监控视频,亟需研究高效的监控视频编转码方法。  在监控视频编码方面,现有的大部分编码方法没有充分利用监控视频自身的特点,压缩效率并不理想。针对此问题,近年来研究人员提出了基于背景建模的监控视频编码方法,通过利用固定场景监控视频背景长期静态的特点,取得了很好的压缩效果。但是该类方法需要将建模得到的背景图像以高质量(同时意味着高码率)的形式编入码流,由此引起了码率的瞬时突增,不利于平滑传输,容易造成后续图像的延时或丢失。与此同时,随着移动互联网的普及和带宽不断提升,通过移动终端来访问监控视频的需求显得日益迫切。因此,为了适应不同尺寸、不同处理能力的终端,需要对监控视频进行高效率转码,特别是结合最新的视频编码国际标准H.265/HEVC中基于四叉划分结构的可变编码块来大幅度提升转码效率。针对上述问题,本文利用监控视频场景分析技术,结合监控视频背景长期静态的特点,进行了如下创新研究:  第一,提出了与HEVC四叉划分结构相适应的前景分离的编码方案。感兴趣区域是监控视频编码过程中需要以较高清晰度进行编码的关键区域。而传统的感兴趣区域由于固定大小编码块的限制通常用矩形区域来进行表示,从而使得感兴趣区域中通常还含有非感兴趣的数据。针对此问题,本文采用的与HEVC编码结构相适应的前景提取方法,使得所提取的前景边缘与HEVC编码结构相一致,从而更利于HEVC的编码。前景和背景分离后,采用HEVC对前背景分别编码,支持无背景、固定背景和原始场景三种码流模式,有利于监控视频的传输和存储。  第二,提出了一种基于编码单元分类的AVC到HEVC转码算法。该算法通过编码单元中背景区域在块尺寸中所占比例将编码单元分为三类:前景编码单元、背景编码单元和混合编码单元。在此基础上通过对每类编码单元的特性进行统计分析,对不同类别的编码单元采用不同的转码加速策略,包括编码单元划分提前终止、预测单元选择和运动估计简化。实验表明,与传统的全解全编转码方法相比,本方法可以在编码质量无明显损失的前提下,实现约50%的复杂度降低。  第三,针对基于背景建模的监控视频编码方法中需要高质量编码背景帧而造成的码率瞬时突增问题,提出了背景图像质量可伸缩编码方法。该方法的基本思想是将高质量背景图像表示为一个低质量背景图像与多层背景残差之和,从而可以用与普通帧内编码图像相当的码率来将这一低质量背景图像与多层背景残差分别编入码流。实验证明了本方法的有效性,并且与基于单幅高质量背景帧的编码方法相比,在同等编码质量的情况下,不仅能够平滑码率,还能实现平均5.88%的码率节省。  第四,针对海量监控视频多层次存储和查询的需求,将上述算法进行了集成,实现了监控视频的高效分级存储系统。其基本思想是通过背景建模,将原始视频序列分为前景层、背景层和残差层,从而对不同层采用不同的编码方法,形成不同的码流;而解码端则可根据需要来重建不同质量的监控视频。实验表明该系统可以大大降低存储及传输代价,对当前海量监控视频数据具有较高的应用价值。  本论文基于场景分析技术提出了多项监控视频的编转码方法,对提升监控视频的编转码效率、解决高质量编码背景帧而造成的码率瞬时突增问题等具有一定理论意义与应用价值,从而为未来更深入研究基于前背景分析的监控视频编码方法与技术奠定了基础。
其他文献
该文借鉴了GIS中传统的二维数据管理技术,并在此基础之上发展了管理海量三维数据的能力,并在空间索引、数据压缩、动态调度等方面进行了有益的探索.设计并实现了一套完整的基
该课题在国家863计划项目——动态联盟协同项目管理系统的支持下,针对动态联盟环境下项目管理过程中的进度计划问题,在进度计划模式,进度计划图形技术,进度资源的平衡优化等
并行分布计算已经成为一种解决许多大型科学和工程问题的十分有效的方式,特别是在高阶矩阵运算方面,如解大型方程组等,并行计算的应用有效提高了求解的效率.M矩阵及逆M矩阵是
随着经济全球化和新技术革命特别是信息技术的发展,企业所处的市场环境发生了根本性的改变,市场竞争已由原来的单个企业之间的竞争转向企业集团与企业之间形成的供应链之间的竞
该文研究的是多模板的实时状态下的音频检索.研究的切入点是电视广告,研究的目标是要建立一个基于音频信息检索的电视广告监播系统,该系统的具体功能是对指定的几个电视广告,
随着多媒体技术及网络技术的飞速发展,人们对数字产品的获取极为迅捷方便,但是这些数字产品的原创者的版权和经济利益如何得到保护?数字产品是否安全、可信?围绕这一问题,近几年
本文研究了从视频中跟踪复杂的非刚体运动的方法,以及从视频中提取可以用于动画合成的人脸面部运动参数的方法。文中的主要成果包括: 1.提出了概率主动轮廓模型以稳定的跟踪
随着电子商务技术的日益发展,移动agent技术可以用来进行市场调查、商品买卖及离线拍卖等.事实证明只有当用移动agent构建的系统的安全性得到确切的保证后,才能被大众用户所
网络带宽和处理能力的快速增长使得音频/视频等多媒体业务大量涌现,这些新型的多媒体业务对网络的服务质量(QoS)提出了新的要求,因此QoS支持成了互联网上多媒体通信业务所面临
该文以建设银行洪山支行的需求为背景,论述了数据仓库以及数据挖掘在银行业务中的应用.概述了面向主题的银行数据仓库的构建方法,论述了客户分类、风险预测以及业绩考核系统