精细可分级视频编码算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:suixin1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着宽带网络的发展,新型的P2P流媒体,IPTV,视频会议,视频监控等对实时性要求较高的业务对当前的视频编码技术提出了新的挑战。它对视频编码的要求也不再仅仅是单纯的追求高压缩率,而且还要求视频流能够很好的适应各种不同的传输环境和用户终端,具有一定的容错性和可伸缩性,以及能同时提供图像质量、时域、空域的可分级能力。可分级视频编码方案是解决Internet流媒体应用中带宽波动的一种有效方法。但是,传统的可分级编码仅能提供粗糙的可分级能力,接收端经解码之后得到的图像随着网络状况的变化而呈跳跃性地变化,无法精细地匹配网络带宽的变化。MPEG-4标准中采用的精细粒度可分级(FGS)能够解决精细匹配网络带宽的问题,还能够获得较好的差错复原能力和解码复杂度可分级能力,但是编码效率较低。   针对FGS编码效率较低的这个缺点,本文提出了四种基于宏块的改进方案。首先通过分析MPEG-4 FGS中选择增强的码流分配的优缺点,在保持其码流重点分配给特殊宏块,从而获得较好主观视觉提高的优点上,对其码流由于需要多传送上移的比特平面数而造成的编码效率较低的缺点,提出将增强层信息贡献于提高编码器基本层编码效率,充分利用可利用的增强层信息,预测消除输入视频信息的时域冗余,和增强层残差信息的时域冗余,既抑制“误差漂移”问题的产生又提高了FGS的编码效率。在此基础上,本文又提出了三种针对提高视频主观视觉效果的方法,将改善视频主观质量与客观质量结合起来。利用有效的信道资源和码流资源,引入宏块分割,人脸检测,以及运动跟踪提出三种自适应选择增强感兴趣区域的算法,从而达到主观视觉效果的提高。其中这三种自适应算法分别结合了H.264编码宏块分割的特点,模式识别中Adaboost人脸检测以及开源库OpenCV下运动对象跟踪的编码方式,根据不同的视频序列,自适应选择人眼最感兴趣区域,提高视频的主观效果。通过PC机实验仿真结果表明,本文提出的改进精细粒度可分级编码方案对改善FGS编码效率效果明显,不仅提高了精细粒度可分级编码的编码效率,而且对视频主观质量的改善也较为明显。
其他文献
大气散射光的偏振特性变化与大气环境的变化密切相关,因此光在大气传输过程中呈现出不同的散射特性,引起了光偏振特性的变化。本文在分析环境因素对大气散射影响的基础上,以
机顶盒EPG(Electronic Program Guide)功能能为用户实时提供全面的节目信息和定制服务,而DVR(Digital Video Recorder)功能能让用户将他们喜欢的数字节目录制到机顶盒内置的
近些年平面、超薄的超表面快速发展并展现出前所未有的光束调控能力,这将为集成电路、平面显示、超分辨率成像、数据存储、光学隐身、量子信息处理等诸多领域提供一系列性能更高、功能更强的新型超薄光学器件。因此,对超表面特性及其实际应用的研究具有非凡的意义。本文根据PB相位的相关理论并借助FDTD仿真方法重点研究了适用于圆偏振光的超表面的特性。具体研究内容如下:(1)提出一种由金属矩形开口共振环阵列组成的新型
随着通信技术的快速发展,针对实际应用中出现的通信手段过多,彼此相对孤立的问题,业界提出的一种信息服务技术解决方案:统一消息服务(UMS,UnifiedMessagingService),这种技术
学位
21世纪,随着数字信息技术、多媒体技术和互联网技术的进步与发展,数码相机和网络照片越来越接近人们的日常生活。这种由数码相机拍摄由电子感光设备获取然后通过数字化存储的
近年来,以计算机辅助语言学习为代表的语音评测系统越来越多的运用在口语考试和语言教学活动之中,不仅提高了评分工作的公正性、高效性,保证了考试成绩的客观性,而且增强了教学反
第四代移动通信系统,简称4G,目前已经成为全球无线通信技术研究的热门,它将使用大量的关键技术以实现高数据传输率。论文选择符合4G要求的若干关键技术进行了下述研究:仿真验证
数字波束形成是在数字信号处理方法的基础上建立起来的一门技术,广泛用于雷达、声纳、通信和电子对抗等领域。论文针对数字波束形成中算法的稳健性、移动目标的数字波束跟踪
随着计算机视觉与模式识别领域关键方法的不断提出与改进,人脸面部表情识别作为情感计算的重要组成部分,近年来成为国内外众多学者研究与探讨的热点。通过对表情识别的研究,
伴随着我国经济快速发展和城市化进程加快,资源、环境和生态压力加剧,日益频发的自然灾害给社会造成巨大的生命和财产损失。应急物资调度作为灾害应急管理的核心环节之一,已