基于纹理分析与合成的视频编码

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:okey100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近二十年来,图像和视频压缩取得了很大的进步。就压缩效率来说,最新的JPEG2000和MPEG-4 H.264/AVC大大的超过了它们的前几代标准。然而众所周知,任何判断标准都没有视觉质量更具有雄辩力,但所有的编码机制都仅仅考虑象素间的统计上的冗余,而完全忽略了知觉上的冗余,也就是说以往视频压缩编码技术的评价准则以率失真性能(Rate-Distortion Performance)为主,虽然这一指标被广泛采用,但并没有完全反映人类的视觉特性。从本质上来说,压缩机制和视觉系统面临着一个相似问题,即,怎样以一种高效率和有效的方式来描述视觉对象。我们还是有可能在压缩系统中采用某种视觉技术来达到感知保真度而不是象素保真度的。为此,本文对视频图像中的主观视觉质量进行了研究,提出了基于纹理分析与合成的视频编码器和解码器。它主要用一个纹理分析器识别出这些纹理区域,再用一个纹理合成器对这些特殊的纹理区域进行合成。其余的区域则采用传统的视频编码方法进行编码。对于视频图像中纹理区域的检测与划分,本文采用了MPEG-7中EHD和SCC描述子作为相似度准则对图像进行分割与合并。用EHD和SCC作为相似度准则计算各个宏块之间的距离,如果它们之间的距离小于一个给定的阈值,则认为它们的纹理特性相似,就把这两个宏块合并到同一集合中。本文对全局运动估计的仿射模型(Affine Model)进行了一定的研究和分析。对于纹理区域的合成,采用基于仿射模型的全局运动估计得到仿射参数,然后把仿射参数传到解码端,并在解码端对相应的纹理区域进行合成。此外,本文还提出了一种基于碎片缝合的纹理合成的方法。它首先通过时域直接模式得到纹理块的运动向量,然后对运动向量进行纠正。接下来对纹理块用重叠块运动补偿进行处理。之后把每个纹理宏块划分成4个12×12的重叠的碎片,并通过重叠块内像素之间的差异来决定用前向、后向还是双向预测。然后,在重叠区域内找到一条最优的缝,缝的两侧的像素或保留或更新。经过这样的处理,合成后的纹理很好地保持了原来纹理的特性,看上去没有明显的变化。实验结果表明这种纹理合成方法能与基于全局运动模型的合成方法取得相似的结果。
其他文献
军队装备维修教学一直受装备机件庞大,不易教学,设备机件成本高,实习器材匮乏等因素的困扰;而实装教学训练保障投资大,特别是新装备、精密机件要求高,无法实施工作状态下的实拆实装
并行多线程程序设计方法现在已经越来越普及,尤其是在实时系统中,已经成为提高系统实时性的关键技术之一。然而,对共享数据的同步访问机制又在一定程度上降低了程序的并发执行程
随着大规模集成电路的飞速发展和广泛应用,其设计手段的进展缓慢成为技术发展中急需解决的瓶颈问题,迫切要求IC-CAD工具自动设计系统进入更高的层次。而系统功率的增加以及能源
实时信号的处理消费了全世界大部分的计算能力。可编程并行处理越来越多地应用到广泛多样的信号处理中(例如科学计算、视频处理、无线电、医疗、通讯、译码、雷达、声纳和成
随着Internet重要性的日益提高和网络结构的日益复杂,越来越有必要对网络中的流量情况进行深入的了解、分析,以利于发现网络瓶颈,优化网络配置,并进一步发现网络中可能存在的潜在
在全球化的趋势下,教育教学的地位日趋重要,传统的教育教学方式由于其局限性已经无法满足现阶段不断提高的课程学习需求。本文通过对各个高校和培训机构中网络化课程的建设所
随着分布式数据库系统发展,传统的C/S访问模式会对数据库服务器产生瓶颈效应,因此引入移动agent进行分布式数据库访问系统设计,这样可以减少对网络带宽的依赖。另外随着移动设备
中间业务属于新兴的银行业务,主要是为客户提供多种金融服务。银行开办中间业务既可以树立良好的公众形象,也可以取得可观的经济效益,它是银行发展的重要发展方向。随着中间业务
物体表征和识别是模仿人类视知觉能力的一个重要课题,但任务艰难。为了取得更好的效果,我们需要从人类的视知觉机制上有所借鉴。人类视知觉是源自于数亿年的进化而产生的复杂
随着Internet的飞速发展,人们越来越多地感受到它带来的好处,但是Internet所面临的安全状况日益复杂。目前,网络蠕虫已经成为了互联网的首要安全威胁之一,蠕虫的爆发经济损失