论文部分内容阅读
为了有效地统计信源的高阶相关性, Context模型被大量使用。但是该模型却面临着一个严重的问题-“模型代价”问题。该问题的产生是由于在统计过程中无法获得足够的数据从而使得对当前编码符号的条件概率的统计结果不理想。为了解决这个问题,引入了Context模型量化。对Context模型进行量化使得当前编码符号的概率更易统计且结果更精确,这就解决了Context模型的“模型代价”问题,并且得到最佳的编码效果。许多实验已经证明在选择合适的失真度准则的前提下,Context模型量化和一般的矢量化相似。故用普通矢量量化的方法也可以对Context模型进行量化,即可以使用聚类算法来对Context模型进行量化。但是,传统的聚类算法在聚类时需要给定聚类数。因此,聚类数为多少时才能使得聚类的效果最好就成为了目前的主要问题。目前较为常用的聚类算法是K均值聚类算法。由于K均值算法对初始化聚类中心的选择较为敏感且聚类数也是人为给定的。这就导致了下面问题的发生:一、随机给定的初始聚类中心能否得到最佳的聚类结果;二、聚类数为多少的时候聚类结果为最优。为了解决上述问题,本文将遗传算法与K均值算法进行了结合,提出了遗传K均值算法。遗传算法是这几年发展起来的一种用于寻找全局最优解的算法,该算法借鉴了生物遗传学的一些概念与原理,通过自然选择、交叉、变异等步骤,使得种群中个体的自适应能力大大提高。只要选定了合适的适应度函数,通过遗传操作就能得到最优的解集(或种群个体)。遗传算法作为一种应用比较广泛的全局搜索方法,已经在很多领域中被广泛使用。为了设计最优的Context量化器,本文选择了遗传K均值聚类算法来对Context模型进行量化。其中,遗传算法利用自然选择的机制得到最优的个体,进而将遗传算法所产生的最优的种群个体上的有效的等位基因作为K均值的初始化聚类中心,并且把染色体上的有效基因的数量作为聚类的类数。这样就解决了K均值聚类算法受到初始化条件的限制。同时遗传算法也是一种全局搜索最优的方法,克服了K均值算法易陷入局部最优解的缺点。通过K均值聚类加快了收敛的速度。实验表明基于遗传K均值算法的Context量化比一般的基于K均值算法Context量化效果更好,能够找到最小的码长。基于遗传K均值算法能够找到最佳的聚类数。