论文部分内容阅读
随着计算机硬件性能的提升和算术编码的广泛应用,基于高阶Context模型算术编码得以在熵编码系统中实现。一般概念上认为,为了有效统计信源复杂的高阶相关性,使用高阶Context模型便可以更好的反映当前所要编码符号的概率,但事实证明即使用足够多的样本来训练,高阶Context模型也很难在统计中有效收敛于信源的真实分布,编码压缩效果反而会降低,这就是基于Context模型无损压缩编码遇到被称为"Context稀释”或“模型代价”的问题,此外高阶Context模型无论在训练还是编码中都需要如几何级数增加的计算量和存储空间。为了解决“模型代价”和计算量、存储量过高的问题,一种有效的方法是对Context模型进行量化。Context模型量化是对经过一定训练而建立的Context条件分布模型进行合并得到简化的并且量化误差较小的Context量化模型,使用量化后的模型进行熵编码不仅能够实现,还能解决“模型代价”问题,得到理想的编码效果。有研究者证明在选择了合适的失真量度后,Context模型量化问题等同于普通的矢量量化问题,使用聚类算法便得到最优Context量化模型。这又将面临两个问题,给定聚类数时结果是否全局最优,聚类数为多少时结果为最优。为了解决这两个问题,我们在众多聚类算法中选择了新近提出的一种称为基于近邻传播聚类的算法作为研究对象,通过对该聚类算法原理的学习,针对Context模型量化的特点,提出基于近邻传播聚类的Context模型量化算法。实验证明基于近邻传播聚类的Context模型量化算法比基于矢量量化的Context模型量化算法在熵编码中的编码效率更优,基于近邻传播聚类的Context模型量化算法计算时空复杂度较小且能找到相对最优的Context模型条件分布的量化聚类数,能够较好地解决“模型代价”问题。