论文部分内容阅读
Context建模熵编码技术被广泛应用于数据压缩中。提高Context建模熵编码效率的途径是获取编码性能较好的Context模型。借助统计计数的方法来估计Context模型中各个条件概率分布时,会面临由于模型阶数高以及统计计数值不充足而带来的“模型稀释”问题。Context量化通过合并条件概率分布来降低模型规模,从而缓解“模型稀释”带来的编码性能下降问题。然而目前根据Context树建模的Context量化实际上只适用于符号数较少的信源,而以最小化自适应码长为目标的Context量化器又只能应用于二进制信源。因此,有必要针对多进制信源,设计优化Context量化器以保证量化划分和量化级数被同时优化。另一方面,Context加权可在不增加模型规模的前提下尽可能利用信源相关性。然而现有Context加权没有对其加权性能的评价方法,使得在编码过程中,加权操作需要一直进行。同时,权值的设定大多来源于经验或者根据模型编码性能进行相应计算,没有对权值进行优化,这导致未能将Context加权的性能充分发挥。鉴于此,本文针对Context量化、Context加权方法存在的问题进行研究,提出描述长度增量、加权代价的概念和性质,并提出可选择Context加权、权值优化等算法改进。随后,将改进的算法应用于微生物基因组序列和图像的压缩应用中,以改进其压缩效率。具体来说包括:将最小化描述长度作为Context量化器的优化目标;提出了描述长度增量的概念,通过分析描述长度增量的性质,确定其作为多个计数向量的相似测度,并将其应用于智能聚类算法中来实现优化Context量化器。此外,针对1阶Context模型探索了信源取值相关的量化方法,借助动态规划来实现多进制信源情况下,1阶Context模型的全局最优模量化。通过分析Context加权过程中描述长度的变化情况,提出了加权代价的概念,分析了加权代价的各项性质,并证明Context加权近似等价于各个参与加权的计数向量的描述长度加权,同时证明在Context加权过程中,最小化加权后模型的描述长度等价于最小化加权代价,从而提出一种在加权前对Context加权进行评价的方法,以实现可选择Context加权,以便在编码前排除那些有可能引入过高加权代价的加权操作。同时,以最小化加权代价为目标,给出了基于多模优化算法(MOA)的权值优化算法,并讨论针对统计平稳信源的最小二乘权值优化方法,从而给出优化的编码结果。在微生物基因组序列压缩应用中,通过使用两种映射方法将微生物基因组序列映射到数值信源,并使用可选择Context加权和权值优化方法对其进行编码;对图像信源,则将最小描述长度Context量化器用于替代经验量化器,从而提高模型的编码性能;对于警用指纹图像压缩,采用可选择Context加权和权值优化协同的方法对其进行编码,以提高存储效率。实验结果表明,最小描述长度Context量化器能够获得略好于其他量化器的图像编码结果。而可选择Context加权和权值优化方法不论对微生物基因组序列还是对警用指纹图像,均能够获得更好的编码结果。