基于压缩视频的图像插值技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:k5105320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像插值是最基础的图像研究课题之一,许多的图像插值方法在文献中被提出,用以解决非压缩图像的插值问题。然而,大量的视频序列是以压缩格式存储的,或由带宽限制要求视频以压缩形式进行传输。一些基于非压缩视频的图像插值方法,当直接应用于压缩视频的图像插值时,往往得不到较好的效果。这是因为,一方面,这些方法没有利用视频码流中已有的信息;另一方面他们没有考虑压缩视频的量化误差,而量化误差在一些情况下很明显。关于上述问题,我们在研究H.264/AVC和MPEG-2压缩视频的图像插值方面做了一些努力。我们提出了一种对H.264/AVC压缩视频,基于模式指导的帧内视频图像插值方法。我们在设计插值滤波器的时候考虑了帧内方向预测模式信息。对每一个帧内方向预测模式,我们在经典视频序列训练集上训练出一组相对应的最优的插值滤波器,所以每一个插值滤波器能自动适应于与他对应的一个帧内方向预测模式,更进一步地,量化因子作为上下文参考也参与到插值滤波器的设计与选择。实验结果表明该模型相比于其他传统的模型Bicubic, Bilinear, LAZA和NEDI,能提高插值的性能,同时保持低运算复杂度。进而我们提出了一种对H.264/AVC压缩视频的基于模式指导的帧间视频图像插值方法,对每一个帧间帧(P帧和B帧)而言,帧间预测模式被考虑来获取到运动信息,如motion vector(运动向量)。每一个在帧间帧的待插值像素点,它的插值滤波器是由它根据运动信息的对应参考点的插值滤波器拷贝而来,而双向参考的待插值像素点,取其双向插值滤波后得到的像素值的均值。这样的设计不破坏压缩视频的结构。实验结果表明该模型相比于其他传统的模型Bicubic, Bilinear, LAZA和NEDI,能提高插值的性能,同时保持低运算复杂度。借鉴H.264/AVC帧内预测模式和边缘指导的图像插值技术的成功经验,我们提出一种基于MPEG-2压缩视频的方向插值方法,在模型中,8x8的帧内预测模式帧中的规则块在变换域被分成九种方向,然后在这一块上的插值被认为是沿着这一像素块的方向。每一个规定的方向,我们在经典的视频序列训练集上训练出一组最优的维纳插值滤波器,并用这组滤波器进行插值。利用相似的方法,我们对每一个帧间帧的规则块来说,沿着其方向的对应块,作为该块的插值参考,实验结果表明该模型相比于其他传统的线性的插值模型Bicubic和Bilinear和方向指导的模型LAZA和NEDI,均能提高插值的性能,同时保持低运算复杂度来满足实际应用。
其他文献
近年来,电子系统集成度提高带来了频发的间歇性故障,使容错方案的设计提出了新的挑战。观察故障对系统中各个层次的影响过程对容错方案的设计有重要意义。另一方面,为了评价各种
随着互联网的迅猛发展,信息容量呈爆炸性趋势增长,用户面临着信息过载和资源迷向的问题,用户要想获得一个比较全面、准确的结果,就必须反复调用多个搜索引擎。准确的获取资源
随着国际互联网的迅速发展,Internet上站点个数及网页数量呈爆炸式增长。面对信息的海洋,用户试图通过浏览Web来发现实时信息变得非常困难,而对Web信息进行实时监测要求用户
随着多核处理器的出现,多核之间共享存储编程模式的有效线程同步问题变得更加严峻和迫切。事务存储最早作为一种替代锁同步的并行编程模型被提出,现在已经成为了在并行程序设计
随着互联网信息量的飞速增长,出现了多种帮助用户获取信息的网络服务。其中,问答社区作为一种基于用户交流互动的知识分享平台而受到欢迎。问答社区积累了大量的问答资源,用户不
随着网络技术和各种计算技术的不断发展,视频服务的需求已多样化。为了提高编码效率和服务质量,可扩展视频编码应运而生。论文从视频传输的实际要求出发,以Wyner-Ziv架构为基
目标跟踪是计算机图像处理学科领域的重要组成部分,为图像处理的高层语义分析提供了丰富的基础信息。但是在目标跟踪算法中,由于被跟踪模型的非刚性结构,场景的光照影响,目标
随着现代社会的信息化的普及和现代服务业的快速兴起,众多的提供者提供着其所拥有的服务资源进行服务,并且寻找着客户,同时客户的需求也越来越个性化,并在众多服务提供者提供
随着互联网技术的快速发展,互联网上的文本信息呈现飞速增长。如何从海量文本中快速准确地抽取人们需要的知识正在成为研究的热点。其中,从文本中自动抽取实体关系的研究显得
生物特征识别技术基于个体的生理或行为特征自动地识别个体。生物特征包括脸、指纹、虹膜、手臂几何、耳、签名和声音,其中虹膜被认为是具有最好的识别效果。虹膜识别是一个识