GPCA在视频可伸缩编码中的研究和应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户：purpleplain

【摘要】

：

数字存储、通讯和互联网的飞速发展使海量的视频数据出现在人们生活的方方面面，视频成为人们获得信息的主要载体。尽管网络带宽、磁盘容量、内存等还在持续增大，但对视频数据进

【作者】

：

姚蕾

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2007年期

【关键词】

：

视频编码 GPCA 混合线性模型可伸缩性编码运动模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数字存储、通讯和互联网的飞速发展使海量的视频数据出现在人们生活的方方面面，视频成为人们获得信息的主要载体。尽管网络带宽、磁盘容量、内存等还在持续增大，但对视频数据进行压缩是大部分媒体服务的前提，因此研究高效的视频压缩算法具有重要意义。此外，为了适应网络带宽的变化、支持不同的终端和达到更好的无线传输服务，人们提出了可伸缩性编码的概念，实现视频的可伸缩性，使得视频在可获得的资源下达到最佳质量。另一方面，视频的应用已走出以播放为目的的局限，视频数据的分析和理解也成为研究的热点。本文主要工作在于将Generalized Principal Component Analysis(GPCA)应用于视频编码，取代传统编码框架中的离散余弦变换(DCT)，达到了更好的视频压缩效率，并在此基础上实现了信噪比(SNR)可伸缩性。另外，利用在运动预测得到的运动向量，尝试用GPCA为视频建立多运动模型，并检测运动物体。本文首先介绍了视频编码在通信、媒体服务等领域的重要性，根据现有几个重要的国际标准的演变历史，介绍了视频编码的发展情况和研究现状。第二章简要地描述了传统编码框架，并分析了新兴的视频编码标准H.264的特性。第三章介绍了可伸缩性编码的概念，着重描述Motion Compensation TemporalFilter(MCTF)及其对H.264在可伸缩性编码(SVC，Scalable Video Coding)方面的扩展。第四章简要地介绍GPCA的基本原理，并将GPCA引入到传统的编码框架中。GPCA的作用是为数据集估计混合线性模型，与PCA的单模型相比，多模型具有明显的优势，能更简洁地表达数据，揭示数据分布情况。我们用GPCA对残差作变换，消除数据的空间冗余，在此基础上实现了SNR可伸缩性，并讨论了降低编码算法复杂度的几种方法。第五章将GPCA用于分析视频中运动对象。与图像相比，视频的一个重要特点是相邻帧具有关联性，压缩算法的运动预测模块得到的运动向量反映了视频中物体的运动信息。不同的运动物体具有不同的运动模型，利用运动向量提供的运动信息为视频图像建立多运动模型，可以用于运动物体检测和跟踪。第六章具体描述了实验的过程，并对实验结果作了一定的分析。最后对本文作简要的总结，讨论了未来的研究方向。

其他文献

英语作为第二语言的多媒体语音数据库设计制作及初步测试

语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，近年来，计算机语音识别的应用有了长足的进展，基于英语的特殊地位，世界上对于英语作为第一语言的语音数

学位

语音识别(ASR)识别率人机接口多媒体语音数据库美尔频率倒谱系数(MFCC)

煤自燃温度场的数值模拟

煤层自燃严重影响着煤炭工业发展，给矿井生产带来极大安全隐患。由于实际条件下的煤自燃过程很难描述清楚，使得煤层自然发火预测预报技术的发展受到严重制约，当务之急是建立有效

学位

煤自燃对流扩散方程特征有限元法二重网格算法可视化

模糊判别分析在妊高征预测中的应用研究

妊娠高血压综合征（简称妊高征）是妊娠期特有的疾病。发病率在我国为9.4%,国外为5%～12%,该病严重影响母婴健康,是孕产妇和围生儿患病及死亡的主要原因[1]。妊高征的发病原因及病

学位

多元统计分析模糊统计学模糊判别分析FSAS平台妊高征预测

基于多Agent的WebGIS系统的研究

基于多Agent的WebGIS系统的研究,是当前和今后一段时间的研究热点。本文在讨论了相关的基础理论之后,提出了基于Agent的WebGIS的体系结构,并给出了详细的功能说明及关键技术

学位

WebGIS多Agent专家系统智能决策房地产

针对代码克隆的面向对象程序的重构研究

软件重构是软件工程的一个重要研究领域，是当前软件工程界的一个重要研究课题。通过软件重构，人们可以去除软件中的不良设计，改进软件质量。代码克隆是软件源程序中普遍存在的一

学位

软件重构面向对象程序代码克隆克隆检测软件维护Java语言

多级分离技术及若干问题的DNA算法研究

DNA计算是一种新的计算模式，它以DNA(deoxyribonucleic acid，脱氧核糖核酸)为“原料”，以生化实验为工具进行计算。DNA分子具有庞大的存储容量，DNA计算具有其它计算方法无法比拟

学位

DNA计算多级分离粘贴模型马步遍历图顶点着色地图着色

油气藏地质建模方法研究

地质建模是油藏描述技术的核心内容，是建立定量的储层模型，提高油气产量的关键技术。目前国内主要使用国外的商业软件进行地质建模，对建模算法的基本理论、核心参数的地质解释等

学位

地质建模变差函数协克里金法序贯高斯法截断高斯法序贯指示法

Multiprotocol Label Switching（MPLS）-Traffic Engineering And Its Strategy

近年来，因特网业务增长迅猛。随之，IP网络中承载运输的数据流量也由此急速增长；因此有效的管理分配网络中的资源以提供用户可靠或可接受的性能变的越来越重要。多协议标签(MPLS)

学位

流量工程多协议标签交换IP网络数据流量路由算法吞吐量

IPV6及其在3G网络中的应用研究

移动网络的发展方向是“全IP移动网”．IPv6已经被3GPP组织确定为构筑下一代移动网的基础和3G必须遵循的标准，本论文主要选择了未来3G网络中核心协议之一——移动IPv6协议中的切

学位

3G移动IPV6切换时延NS2

以目标为导向的时序图规划算法的研究

智能规划是当前人工智能领域中极为活跃的一个研究热点,它已广泛应用于自主机器人、航空航天、自然语言理解、知识推理、人机交互、数据挖掘等许多高技术领域。虽然它的一些

学位

人工智能智能规划图规划时序规划目标导向

GPCA在视频可伸缩编码中的研究和应用

与本文相关的学术论文