论文部分内容阅读
3G指第三代数字通信,全称为3rd Generation。1995年问世的第一代数字手机只能进行语音通话。1996到1997年出现的第二代数字手机增加了接收数据的功能,如接受电子邮件或网页。3G与前两代的主要区别在于传输声音和数据的速度上有很大的提升,它能够处理图像、音乐、视频流等多种媒体形式,提供包括网页浏览、电话会议、电子商务等多种信息服务。视频流是一个重要的媒体形式,视频信息具有诸如直观性、确切性、高效性、广泛性等一系列优点,但是视频信息的信息量太大,为了有效应用视频,必须解决视频压缩编码的问题和压缩后视频质量保证的问题,这两者是相互矛盾的。本文的任务是既要有较大的压缩比,又要保证一定的视频质量。管2003年3月,ITU-T/ISO正式公布的H.264视频压缩标准比以往标准有更出色的性能:在相同的质量下,其码率能降低一半左右,或者说在相同的码率下,信噪比明显提高。然而,即使这样的码率下,手机中直播的电视节目图像质量还是不太理想。在现阶段还无法进一步提高其压缩比的情况下,可以根据画面内容的不同分配不同的码率,在传输前将视频画面中感兴趣的画面检测出来;或者将感兴趣区域多分配一些码率,不感兴趣区域少分配一些码率;或者保存这些区域,在解码时做一些处理。对于一帧视频画面,人眼感兴趣的主要是:人脸、台标、字幕、运动的物体,以及当一幅画面大部分区域向一个方向运动时却向另一个方向运动的物体。本文对提取图像下方标注字幕和台标和对提取出来的感兴趣区域进行增强调节进行了研究。主要内容如下:
⑴通过研究视频编解码过程得知,量化视频编解码过程对图像的质量以及压缩比率有很大影响。量化的公式中有两个主要的影响变量:量化步长QP和dead-zone(即f值),QP可以通过宏块级调节和帧级调节两方面来调节,f值调节作用没有QP明显,调节时对码率的影响没有QP大。
⑵提取出感兴趣区域-字幕。分别研究了字幕在空域、时域、频域(压缩域)中的特性,提出了三种提取字幕的方法:①空域水平垂直投影检测字幕法;②频域AC系数和提取法;③时空域边缘强度帧差提取字幕法。分别给出了算法以及结果,并对三者提取结果的进行了对比分析。
⑶提取出感兴趣区域-台标。根据台标的许多共同特性提出一种提取台标的算法。
⑷在H.264的官方标准测试代码JM86平台上测试本实验的效果。