视频压缩快速帧场自适应算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:edu009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隔行扫描技术自电视技术诞生以来得到广泛应用,很多珍贵视频资料都是隔行扫描格式的,所以在相当长的时间内,它仍然会作为主要视频格式之一活跃在历史舞台上。图像级帧场自适应(PAFF)技术在处理隔行序列时,可将两场合成一帧,按照帧编码方式进行,也可以将其作为两场分别编码;采用帧或场编码可根据编码效果自适应选择。虽然采用PAFF技术使得编码性能有所提高,但会导致时间复杂度上升2倍以上,为了降低时间损耗,本文提出了基于运动检测的one-pass快速帧场自适应算法。本文对MPEG-2和H.264中的PAFF技术进行了深入研究,发现编码方式的选择与图像运动剧烈程度密切相关,且不同标准的帧场选择方式有其自身的特点,这两点对本文算法的设计具有借鉴意义。本文赋予当前帧总方差SSD新内涵,定义其为当前帧与前一帧对应像素差的平方和。针对标清序列,对帧场选择情况进行了测试,结果显示AVS帧场选择有4个特点:帧场选择方式连续性, SSD曲线一致性,运动信息相关性,量化步长相关性。基于上述特点,本文核心算法为:编码前进行决策,运动剧烈时选用场编码,运动平缓时选用帧编码,其他情况延续上一帧编码方式。SSD曲线一致性说明SSD的变化可以描述运动剧烈程度,但因其分布松散,难以直接使用。本文将SSD归一化,用当前帧SSD相对于前一帧SSD的变化率来刻画运动剧烈程度。为了建立其与运动信息之间的对应关系,本文进行了分类测试,粗略选取出帧场切换阈值。然后将阈值与量化参数QP进行三次多项式拟合,使阈值可以根据QP自适应地调整,以更好满足序列特征,取得更优的编码性能。实验显示,与原有PAFF算法相比,在PSNR下降小于0.1dB情况下,编码速度提高40%~60%。本文还发现原帧内预测算法存在块之间的相互依赖性,不利于在编解码工程中并行处理,为此设计了基于原始像素的帧内模式决策算法。本算法可并行地计算各种模式下的预测值,之后再进行模式决策,最后根据缓存中的编码模式利用重构块进行预测编码,有利于多处理器的并行视频编码开发。
其他文献
随着电信技术迅猛发展、网络规模的不断扩大,网络设备的数量和种类也不断增加,这些对电信网络管理就提出了更高的要求。 通过对网络设备中性能参数的定时收集和分析,管理员不
广播电台各个业务系统之间信息流通不畅、缺乏互联标准,为了解决这些问题,提出了All-In-One。All-In-One是一个技术框架,在此框架下,广播电台的播出系统、制作系统、广告管理
指纹识别是因为其悠久的历史以及较高的识别精确度,成为了目前最成熟的生物特征识别技术之一,并被广泛的应用到各个领域当中。然而直到目前为止,非理想条件下指纹识别中仍存在一
本文对基于Internet协作学习系统的设计与实现进行了研究。主要包括以下四个方面的内容: 第一,提出了系统的总体框架的,包括系统中用户角色的设计、用户活动空间的设计等。
生物特征识别技术是一项利用人类特有的生理或行为特征来进行身份识别的技术,它提供了一种可靠、稳定性高的身份鉴别途径。时—频分析工具和线性判别方法是人们关注的两个生
人才评价平台是根据当前人才测评需要和实际测评流程而开发的,为各种专业人才评价业务提供统一管理的系统平台。通过对人才评价业务中信息和过程的管理,实现系统整合和资源、知
电容层析成像技术ECT(Electrical Capacitance Tomography)是近年来获得了快速发展的一种多相流在线检测成像技术,它具有成本低、适用范围广、采集速度快、非侵入式、操作方便和
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。电
工作流管理联盟(WFMC)早在1995年就提出了工作流参考模型和一系列的接口规范,在近几年的发展中,工作流的理论日趋成熟.随着面向对象技术和分布式计算的发展,特别是Java技术以
动词次范畴化信息反映了动词作谓词时所表现出来的不同句法特征的分布,作为自然语言处理进一步发展所不可或缺的知识,汉语中的相关研究还很薄弱。探索面向真实语料的汉语动词