GPCA在视频可伸缩编码中的研究和应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:purpleplain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字存储、通讯和互联网的飞速发展使海量的视频数据出现在人们生活的方方面面,视频成为人们获得信息的主要载体。尽管网络带宽、磁盘容量、内存等还在持续增大,但对视频数据进行压缩是大部分媒体服务的前提,因此研究高效的视频压缩算法具有重要意义。此外,为了适应网络带宽的变化、支持不同的终端和达到更好的无线传输服务,人们提出了可伸缩性编码的概念,实现视频的可伸缩性,使得视频在可获得的资源下达到最佳质量。另一方面,视频的应用已走出以播放为目的的局限,视频数据的分析和理解也成为研究的热点。本文主要工作在于将Generalized Principal Component Analysis(GPCA)应用于视频编码,取代传统编码框架中的离散余弦变换(DCT),达到了更好的视频压缩效率,并在此基础上实现了信噪比(SNR)可伸缩性。另外,利用在运动预测得到的运动向量,尝试用GPCA为视频建立多运动模型,并检测运动物体。本文首先介绍了视频编码在通信、媒体服务等领域的重要性,根据现有几个重要的国际标准的演变历史,介绍了视频编码的发展情况和研究现状。第二章简要地描述了传统编码框架,并分析了新兴的视频编码标准H.264的特性。第三章介绍了可伸缩性编码的概念,着重描述Motion Compensation TemporalFilter(MCTF)及其对H.264在可伸缩性编码(SVC,Scalable Video Coding)方面的扩展。第四章简要地介绍GPCA的基本原理,并将GPCA引入到传统的编码框架中。GPCA的作用是为数据集估计混合线性模型,与PCA的单模型相比,多模型具有明显的优势,能更简洁地表达数据,揭示数据分布情况。我们用GPCA对残差作变换,消除数据的空间冗余,在此基础上实现了SNR可伸缩性,并讨论了降低编码算法复杂度的几种方法。第五章将GPCA用于分析视频中运动对象。与图像相比,视频的一个重要特点是相邻帧具有关联性,压缩算法的运动预测模块得到的运动向量反映了视频中物体的运动信息。不同的运动物体具有不同的运动模型,利用运动向量提供的运动信息为视频图像建立多运动模型,可以用于运动物体检测和跟踪。第六章具体描述了实验的过程,并对实验结果作了一定的分析。最后对本文作简要的总结,讨论了未来的研究方向。
其他文献
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,近年来,计算机语音识别的应用有了长足的进展,基于英语的特殊地位,世界上对于英语作为第一语言的语音数
煤层自燃严重影响着煤炭工业发展,给矿井生产带来极大安全隐患。由于实际条件下的煤自燃过程很难描述清楚,使得煤层自然发火预测预报技术的发展受到严重制约,当务之急是建立有效
妊娠高血压综合征(简称妊高征)是妊娠期特有的疾病。发病率在我国为9.4%,国外为5%~12%,该病严重影响母婴健康,是孕产妇和围生儿患病及死亡的主要原因[1]。妊高征的发病原因及病
基于多Agent的WebGIS系统的研究,是当前和今后一段时间的研究热点。本文在讨论了相关的基础理论之后,提出了基于Agent的WebGIS的体系结构,并给出了详细的功能说明及关键技术
软件重构是软件工程的一个重要研究领域,是当前软件工程界的一个重要研究课题。通过软件重构,人们可以去除软件中的不良设计,改进软件质量。代码克隆是软件源程序中普遍存在的一
DNA计算是一种新的计算模式,它以DNA(deoxyribonucleic acid,脱氧核糖核酸)为“原料”,以生化实验为工具进行计算。DNA分子具有庞大的存储容量,DNA计算具有其它计算方法无法比拟
地质建模是油藏描述技术的核心内容,是建立定量的储层模型,提高油气产量的关键技术。目前国内主要使用国外的商业软件进行地质建模,对建模算法的基本理论、核心参数的地质解释等
近年来,因特网业务增长迅猛。随之,IP网络中承载运输的数据流量也由此急速增长;因此有效的管理分配网络中的资源以提供用户可靠或可接受的性能变的越来越重要。多协议标签(MPLS)
移动网络的发展方向是“全IP移动网”.IPv6已经被3GPP组织确定为构筑下一代移动网的基础和3G必须遵循的标准,本论文主要选择了未来3G网络中核心协议之一——移动IPv6协议中的切
智能规划是当前人工智能领域中极为活跃的一个研究热点,它已广泛应用于自主机器人、航空航天、自然语言理解、知识推理、人机交互、数据挖掘等许多高技术领域。虽然它的一些