论文部分内容阅读
现有的H.264编码技术已经能够达到很好的编码性能,但是由于采取了低复杂度和高复杂度模式区分,以及可选的熵编码算法等,使得复杂度很高。而且滤波的加入又需要很大的缓存空间,这些对于软件平台来说不是重要的问题,但是对于CPU主频低,片内空间有限的硬件平台来说,却是需要大量的优化工作的。因此本文以硬件平台研发为基础,提出了在硬件平台上的H.264算法优化。本文首先在H.264这种视频压缩标准中探索和研究算法的创新与应用。接着在3D图像压缩部分,作者针对3D图像网格压缩的压缩方法进行了介绍与算法的创新。在数字水印部分,重点研究了H.264中的半易损脆弱水印。在主观视频质量评价及检测部分,重点研究了含有马赛克的视频图像的检测方法,提出了以U分量的方差为基础的马赛克检测方法。首先论文介绍了H.264后提出了双路并行模式选择方法,其创新点在于利用了DSP,在低复杂度下将帧间宏块模式选择分配到两个CPU去做,极大地提高了模式选择速度,并利用码率与DCT系数息息相关的关系,使得该方法可以在同等QP的条件下,将码率减小5%—25%。在3D图像压缩单元中,由于已有的一些在拓扑,几何,纹理方面的熵编码算法虽然能够达到一定的压缩率,但其优化空间还很大。为了探索在3D图像压缩中熵编码的冗余和优化,本文分别在纹理,几何,拓扑方面做了熵编码的研究。首先在最消耗复杂度的纹理编码上,对其用了新的熵编码方法,对于浮点数压缩采用了一种动态参考方式,即频繁出现的浮点数被储存在一个缓存区域中,因此新出现的数据如果与缓存区域中的一些数据相同,那么缓存区域的索引号就被编码。这个算法与视频中的运动搜索相似,并且找到了纹理编码中的冗余。其次在拓扑编码上,提出了一种进一步压缩二进制码流的方法。根据拓扑编码的码字规律,对五种符号进行重新分类,将C和R放在一起去编码,并且去掉了很多0和1的组合。重新编码会减少原编码方式的熵,从而达到减少码流的效果。最后在几何编码上,提出了一种新的熵编码方法来编码一系列正数,它首先判断编码数字是否为0。如果不是0,它进一步判断本数字是正数还是负数,然后编码数字的绝对值,这个数字首先被表示为二进制,然后用混合哥伦布编码方法来编码。在这个发明中,0的标志,符号的标志,还有二进制的混合哥伦布码在不同的上下文模型中被编码。基于自适应二进制算数编码的上下文模型在对这些标志和二进制编码之前要进行异或的操作。异或操作意味着在同样的上下文模型中需要比较现在的比特和之前的比特。在数字水印单元,由于目前网络传输视频主要是H.264格式,因此如何保护网络传输的视频流,让码流能够安全的从发送端传送到接收端,成为了一个热点问题,所以本文在H.264压缩域范畴内研究数字水印的添加方法。首先提出了保护DCT系数的压缩域的半脆弱水印的第一种算法,针对压缩域的半易损水印,从保护DCT系数的符号考虑,根据水印来动态调整非零DCT系数正负的个数,从保护图像质量考虑,只更改最高频的DCT系数,从而最大程度的减少了对图像的损害。此种方法较简单且有实用性,易于采用。其次提出了保护DCT系数压缩域的半脆弱水印的第二种算法,针对压缩域的半脆弱水印,从保护DCT的权值和符号综合考虑,建立水印矩阵,每个DCT系数的更改范围控制在2以内,并保护0和1这种DCT系数,使其对图像的影响达到最小。但是这种方法非常复杂,需要不断的更新水印矩阵,在性能较差的平台上不易实现,但是它的水印添加效果较好,能够在保护图像码流的同时,还最小范围的影响图像质量,在高复杂度平台上非常实用。在主观视频质量评价及检测单元,由于主观视频质量主要影响因素有块效应,抖动,模糊,噪声,其中马赛克作为一种特殊的块效应,对视频质量有着很大的损害,因此如何准确的检测出含有马赛克的图像和视频是非常重要的。本文在分析了目前的马赛克检测算法的基础上,提出了新的基于U分量的方差的检测方法,从测试结果来看,本方法相对于已有的空域方法和边缘域方法在错检率和漏检率以及耗时上都有一定的优势,可以达到一般的商用标准。在最后的总结与展望单元,作者总结了本文的创新点并阐述了接下来的工作。