基于遗传K均值聚类算法的Context模型量化研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:zhoujianqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效地统计信源的高阶相关性, Context模型被大量使用。但是该模型却面临着一个严重的问题-“模型代价”问题。该问题的产生是由于在统计过程中无法获得足够的数据从而使得对当前编码符号的条件概率的统计结果不理想。为了解决这个问题,引入了Context模型量化。对Context模型进行量化使得当前编码符号的概率更易统计且结果更精确,这就解决了Context模型的“模型代价”问题,并且得到最佳的编码效果。许多实验已经证明在选择合适的失真度准则的前提下,Context模型量化和一般的矢量化相似。故用普通矢量量化的方法也可以对Context模型进行量化,即可以使用聚类算法来对Context模型进行量化。但是,传统的聚类算法在聚类时需要给定聚类数。因此,聚类数为多少时才能使得聚类的效果最好就成为了目前的主要问题。目前较为常用的聚类算法是K均值聚类算法。由于K均值算法对初始化聚类中心的选择较为敏感且聚类数也是人为给定的。这就导致了下面问题的发生:一、随机给定的初始聚类中心能否得到最佳的聚类结果;二、聚类数为多少的时候聚类结果为最优。为了解决上述问题,本文将遗传算法与K均值算法进行了结合,提出了遗传K均值算法。遗传算法是这几年发展起来的一种用于寻找全局最优解的算法,该算法借鉴了生物遗传学的一些概念与原理,通过自然选择、交叉、变异等步骤,使得种群中个体的自适应能力大大提高。只要选定了合适的适应度函数,通过遗传操作就能得到最优的解集(或种群个体)。遗传算法作为一种应用比较广泛的全局搜索方法,已经在很多领域中被广泛使用。为了设计最优的Context量化器,本文选择了遗传K均值聚类算法来对Context模型进行量化。其中,遗传算法利用自然选择的机制得到最优的个体,进而将遗传算法所产生的最优的种群个体上的有效的等位基因作为K均值的初始化聚类中心,并且把染色体上的有效基因的数量作为聚类的类数。这样就解决了K均值聚类算法受到初始化条件的限制。同时遗传算法也是一种全局搜索最优的方法,克服了K均值算法易陷入局部最优解的缺点。通过K均值聚类加快了收敛的速度。实验表明基于遗传K均值算法的Context量化比一般的基于K均值算法Context量化效果更好,能够找到最小的码长。基于遗传K均值算法能够找到最佳的聚类数。
其他文献
网络技术和视频编码技术的发展,使得近几年各种面向网络应用的视频服务得到不断的发展。视频编码技术的目标也由单纯的追求较高的压缩效率转向了使视频流能够更好地适应终端
近年来,随着近海大陆架的开发,深海渔业的发展和海底大陆架的探测,水声通信在军用和民用领域被投入了越来越多的关注。鉴于国内外许多科技工作者都在从事水声通信领域的研究工作
钩虫是重要的人兽共患寄生虫,寄生于人体可导致贫血,儿童感染钩虫后造成发育迟缓,为了解肠道线虫在儿童中的流行情况和开展儿童肠道线虫病的防治,我们于2004年7月至10月间进
稻纵卷叶螟(Cnaphalocrocis medinalis Guenée)属鳞翅目(Lepidoptera)螟蛾科(Pyralidae),为水稻最主要的害虫之一,是一种分布地域广、对环境适应性强的迁飞性害虫,会影响水
无源光网络技术由于其低成本、高带宽、多业务接入等优点,成为业界公认的理想和长远的宽带接入网解决方案。随着EPON和GPON等传统TDM PON技术的成熟和广泛应用,目前10G EPON、X
面对日益增长的无线业务需求所带来的频谱资源相对短缺的问题,认知无线电(Cognitive Radio, CR)是公认的一种可行的解决方案。认知无线电技术的关键和重点问题是进行频谱感知
蟋蟀科(Gryllidae)隶属于昆虫纲直翅目螽亚目蟋蟀总科(Insecta:Orthoptera:Ensifera:Grylloidea)。蟋蟀科昆虫既是一类观赏性昆虫,又是药用和食用的资源昆虫,同时也是主要的农业
甲状腺激素(thyroidhormone)通过与广泛分布在各种组织中的甲状腺激素受体(thyroidhormonereceptors,TRs)结合,作用于转录过程实现其对靶基因的正性/负性调节,对于机体的正常分
黄花苜蓿营养价值高,适口性好,抗寒性极强,抗干旱、耐盐碱,在解决我国面临的蛋白质饲料缺乏、土壤肥力下降问题中,具有重要的地位和作用。本文针对黄花苜蓿研究现状,以国内的
背景:大量的临床资料和动物实验表明,运动减退、制动或肌肉去负荷均可使骨骼肌出现明显的萎缩。对废用性肌萎缩的预防和治疗,一直是临床医学、运动医学、康复医学及航天医学等领