基于改进哈夫曼的上下文数据压缩算法设计与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:olived0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,生物工程、数字广播、高清电视、航空航天和国防工业等领域每天产生海量的数据需要存储和处理,从而给计算机的磁盘存储和网络传输性能带来了巨大的挑战。对海量数据进行压缩可以节约存储空间和提升网络传输速度,因此受到了越来越多的关注。本文首先研究了目前主流的数据压缩算法以及它们的压缩原理。其中哈夫曼算法因其压缩效率高、编码速度快、易于实现等特点,在数据压缩领域得到了广泛的应用。针对哈夫曼算法缺少上下文之间的关系分析,从而压缩后的数据冗余较大、占用磁盘空间较多等问题,本文提出了一种基于马尔可夫链的哈夫曼数据压缩算法,减少了传统哈夫曼算法的平均编码长度,取得了较好的压缩效果。本算法首先利用马尔可夫链模型探索待压缩数据的上下文关系,把待压缩数据的每个字符作为一个马尔可夫链状态,统计每个状态出现的频率及它们之间转移的次数;然后根据统计结果计算转移概率矩阵,对待压缩的数据进行上下文的相关性判断;最后对有关联的上下文进行合并压缩从而取得较好的压缩效果。当数据量较大时,由于单机节点对数据的处理能力不足,导致无法充分发挥数据压缩算法的效果,因此将本文提出的数据压缩算法移植到HADOOP分布式系统中实现对数据的并行压缩,从而缩短了数据压缩的时间,减少了数据占用的存储空间,进一步加快了数据在网络中的传输速度。
其他文献
提出以曲靖非相干散射雷达作为一种可能的发射源与天籁射电阵组成一套双基地雷达空间碎片探测系统,对该系统的空间碎片探测性能进行计算与仿真分析,包括可探测目标雷达散射截
农业数据具有容量大、关联性强、复杂多变等特点。大数据技术能从庞大的数据集合中寻找、挖掘有价值的数据和知识。推动大数据技术在农业领域的实践和应用,对把握农业信息内
设计实现了一种基于中频注入的雷达回波环境模拟系统,能够按照设定的参数模拟雷达目标回波及干扰环境。对雷达回波的信号模型及空间传播模型进行建模,模拟回波信号的距离、角度
企业的具体情况不同,税收筹划的内容和方法也不尽一样。针对中小企业的特点,从筹资、投资、生产经营和利益分配等几个环节,研究中小企业税收筹划的一般方法。
以自制的选择性固体酸为催化剂,采用二苯胺和1-壬烯为原料制备了壬基二苯胺抗氧剂(NDPA),并研究了其合成工艺。结果表明:通过选择不同的固体酸催化剂,在最优工艺条件下,二苯
食品安全问题日益严峻,构建以农民合作经济组织为主体的食品安全监管体系是一条行之有效的途径,其中关键是发挥农民合作经济组织的功能和积极性。调查了广东地区农民合作经济
煤矿瓦斯对空排放量大,会产生巨大的能源浪费及温室效应。为解决煤矿乏风瓦斯及低浓度瓦斯排放量大、利用率低的问题,开展了瓦斯蓄热氧化利用技术的理论研究。对已建成的蓄热
采用扫描电子显微镜(SEM)、电感耦合等离子体-原子发射光谱仪(ICP-AES)、线性电位扫描伏安法(LSV)等手段研究了铋离子浓度对工业纯铝表面酸性化学镀镍的镀层形貌、镀速、磷含
针对煤矿低浓度瓦斯排放量大、利用率低及煤矿的井下制冷需求的问题,提出一种瓦斯蓄热氧化后热量为溴化锂制冷机组提供余热蒸汽的工艺,在有效解决低浓度瓦斯利用难题的同时,
<正>髋关节置换术是骨科常见手术之一,常适用于股骨颈骨折、股骨头坏死等疾病导致的髋关节功能低下或丧失,能最大限度地恢复髋关节正常功能,缓解疼痛。传统术后护理大都要求