论文部分内容阅读
随着电子信息和计算机网络技术的发展,视频监控系统在技术水平和实际应用等方面取得了长足的进步,被广泛应用于工业、交通、电力和办公,在人们日常生活中发挥重要的作用。但是,现有的技术条件仍阻碍着监控系统在更广范围的推广。本文以视频监控在教育领域的应用为实例进行研究,主要针对若干关键技术,如视频压缩、可疑对象提取和检索等。选取教育领域应用为背景的原因是由需求而推动,具体以教育考试网上巡查系统为研究对象,原因是近年来考试违纪作弊行为越来越隐蔽化和作弊手段越来越技术化,为有效打击违纪舞弊行为,提高教育考试的管理效能,因此教育部计划建立一套包含监控、通信、音视频处理和考试管理等技术的综合性业务应用系统(即教育考试网上巡查系统),实现对全国各级考试机构和考点的监控。随着IP技术的发展,视频监控已向IP化,在这类视频监控系统中,视频处理技术是最核心内容之一,由视频采集、预处理、压缩、传输、解压缩、后处理和显示等部分组成,其中视频编码的压缩效率很大程度上决定了整个监控系统的性能。目前的编码标准中,MPEG-2和MPEG-4相对比较成熟,但压缩效率较低,难以满足在有限的带宽网络中传输海量视频的需要。AVS和H.264是新一代视频编码标准,AVS标准还处于制定和推广过程,而H.264已经成为国际标准且在压缩效率上具有优势,因此本文将围绕着H.264对新的视频监控系统中的若干关键技术展开研究。对于前端编码部分,H.264采用复杂的算法才获得较高压缩效率,与MPEG-2相比增加了超过2倍的复杂度,这影响其实时实现,对编码系统的处理能力提出更高要求。其中运动估计是H.264编码器中最复杂的部分,采用多种块模式、多参考帧和亚像素内插等技术,占整个编码器计算量的绝大部分,因此研究快速、高效的H.264运动估计算法是解决实时编码的关键。对此,论文在编码端提出了一种融合帧间模式判决和多参考帧选择的H.264快速运动估计算法。该算法将运动估计与模式判决和多参考帧选择相结合,综合考虑整数变换与量化、矢量预测、搜索范围、参考帧及其各个块模式之间的相关性,将运动估计算法具体到每种块模式和每个参考帧中,并采用合理的处理方法,在保证编码效率的同时,可大大提高编码速度。此外,还对采用此算法的编码器作进一步优化,最终实现H.264 Baseline编码器的实时编码,满足视频监控的需要。视频流数据传递到中心服务器或分析服务器后,需要对获得的图像和信息进行快速处理,其中实时检测和提取图像中的运动对象具有较高的应用价值。目前主要存在两类提取方法,一类是在像素域中,即以像素为单位对解码后重建的图像进行处理,这类方法比较耗时,故需要提高算法性能才能满足实时需要;另一类方法是在压缩域中,利用压缩域中的一些已有信息来直接进行提取,例如MPEG域中的编码信息或对象编码信息,在对象提取中可以直接利用这些编码信息以加速对象提取,这种方法具有实用性,但处理过程比较复杂,目前仍处于研究阶段。针对于此,本文首先提出一种基于像素域的实时运动对象提取和匹配算法。在解码时将运动矢量缓存,并利用它快速进行运动连通区域标注,在此基础上,利用背景检测算法快速去除背景信息,最终提取到运动对象。此外还利用改进的多分辨率Hausdorff距离算法进行匹配跟踪运动对象。作者采用上述算法对实际监控拍摄的视频序列进行处理,实验结果表明,这些算法可以快速有效地提取和匹配各种运动对象,满足了实时性的要求。其次,本文针对现有视频监控系统分别研究了基于MPEG和H264两种压缩域视频对象提取的新算法。其中,基于MPEG压缩域的视频对象提取算法采用了多分辨率处理方式,实验表明所,提出的算法能够获得较好的对象提取效果。此外,还提出了一种基于H.264压缩域中的摄像机全局运动估计算法,可以准确估计全局运动,在此基础上利用运动矢量累加和投影算法可以实现运动对象提取,实验结果表明该算法能快速准确地计算H.264压缩域中的全局运动,并能实时分割视频对象。在文章的最后介绍和分析了H.264的流处理技术,围绕上述关键视频处理技术总结和提出了一套原型系统,一方面为研究提供支撑平台,另一方面为具体视频监控系统的构建提供参考。