基于内容的高效帧内编码技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:kpqkxx03592
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可独立解码的视频帧内编码帧(Ⅰ帧)具有作为随机访问点、防止错误传播等重要功能,因而在视频应用中扮演着至关重要的角色,现今一些高质量视频应用例如数字电影中也有直接使用全Ⅰ帧编码的情况。然而Ⅰ帧较低的压缩比与其重要程度形成了一对亟待解决的矛盾。近年来,最先进的帧内编码技术多是基于H.264/AVC国际视频编码标准所采用的混合视频帧内编码框架所提出的。因此,从理论上深入理解并完善信源编码理论在混合视频帧内编码框架中的应用,并在此基础上研究提出工程可实现的高效帧内编码算法具有十分重要的理论与现实意义。在理论分析方面,本文认为混合视频帧内编码框架将一帧图像的信源熵用链式法则拆解为多个像素块条件熵之和,并通过帧内预测技术来去除像素块之间的互信息实现对条件熵的逼近;在编码每个像素块时,通过变换技术将块内像素映射为互不相关的变换域信源符号,最后应用熵编码技术对每个变换域信源符号逼近其信息熵。由于帧内预测技术和变换技术中所期望去除的信源符号间互信息很难定义和表达,因此工程上常常以线性相关性代替互信息作为技术优化目标,本文分析讨论了互信息与线性相关性的关系以及这种工程近似方法的合理性。作为对上述相对抽象层面理论分析的延伸,本文更具体地研究了在一个特定的视频图像区域上如何获得最佳的单一模式帧内预测和变换的联合。事实上,最佳的帧内预测就是能完全去除参考像素与当前编码块目标像素之间线性相关性的维纳滤波器,而对应于该最佳预测的最佳联合变换即为在该预测所获得的残差上统计生成的KLT变换。在理论研究的基础上,本文进一步针对帧内预测这一重要技术环节,提出了三种新的高效技术方案,这三种技术都应用了本文之前所讨论的在一个特定视频图像区域上生成最优帧内预测模式的算法。三种帧内预测技术方案有各自适合的应用条件,普通自适应帧内预测技术需要额外编码传输较大量的预测滤波器信息,因此主要适用于高分辨率且纹理细节复杂独特的视频序列;解码端导出自适应帧内预测模式技术无须传输额外滤波器信息,因而可适用于更宽广的分辨率范围,但对解码端的计算能力要求很高;固定预测滤波器系数技术的预测滤波器在线下统计训练得到因而具有最低的编解码复杂度,但其性能取决于编码序列和训练集之间的相似性,难以保证在所有类型的视频序列下都性能良好。实验证明,在对应的应用条件下,三种技术相比当前最先进的国际视频编码标准H.264/AVC均能取得明显的性能增益(尤其是在高分辨率纹理细节复杂的视频序列上)。
其他文献
期刊
内存数据库具有很多传统的数据库系统所不具备的优点,并且采用了与传统磁盘库不同的,针对内存存储结构而设计的架构,使得内存数据库取得比磁盘数据库高得多(10倍以上)的数据
随着科学技术和国民经济的发展,道路交通日趋重要。车速标示牌检测与识别作为智能车辆防撞系统的重要部分日益受到关注。为了帮助驾驶员对可能出现的危险做出预测及警告并确保
多输入多输出(MIMO)系统可以在不增加发射功率和带宽的条件下有效地提高信道容量和频谱利用率,因而在下一代移动通信和宽带无线接入系统中有广泛应用。其中垂直贝尔实验室分
在无线通信中,为抵抗无线信道的衰落出现了协作分集技术,它通过多个具有单天线的移动终端共享彼此的天线形成虚拟多输入多输出(Multiple Input Multiple Output,MIMO)系统,从
高光谱遥感技术的发展是20世纪80年代人类在对地观测方面所取得的重大技术突破之一。传感器可以获得近似连续的光谱信息,覆盖整个可见光至近红外的(0.4~2.4微米)光谱范围。正
由于传输错误、摄像头传感器中的故障像素单元、错误的存储位置和模数转换过程中的计时错误等因素,数字图像常常被脉冲噪声所污染。  脉冲噪声影响了很多图像处理应用的准
USB存储介质以其方便快捷、大容量、便于携带等特点得到广泛使用,这也导致客观上存在USB 存储介质中数据丢失泄露的风险。信息加密技术是应对这种风险的最基本、最核心的技术