中文文本压缩的LZW算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jerryhua1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。
其他文献
介绍了排列问题、组合问题和皇后问题的回溯算法,对《算法设计与分析》课程的学习以及参加“大学生数学建模竞赛”与“中学生奥林匹克信息学(计算机)竞赛”等具有一定指导意义。
以内蒙古赤峰某地褐煤为原料,分别采用氢氧化钾溶液、氢氧化钾与碳酸钾混合溶液两种提取液,进行了 制备腐植酸钾的条件实验和正交实验,探究提取剂用量、固液比、热处理时间对
对三角矩阵的存储映射问题进行了讨论.对于n阶下三角矩阵,若按行主顺序仅将下三角部分各元素依次存储到向量B[1∶n(n+1)/2]中,则可获得矩阵下标集合到向量下标集合的一个一一映射f(i,j)=i(i-1)/2+j,其逆映射为f-1(k)=(p,k-p(p-1)/2).这里i≥j且p=(8k+1-1)/2.对于上三角矩阵,若按列主顺序仅存上三角部分,则可对称地获得类似的一一映射:g(i,j)=f(
利用分光光度法,测算出叶绿素a铜钠盐和叶绿素b铜钠盐在特殊波垂下的比吸光系数,根据Lanmbert-Beer定律,建立起叶绿素铜钠盐定量测定的近似计算方程,并对该方程的应用进行了讨论。
介绍了间苯二酚与蔗糖发生显色反应的适宜条件,其有色溶液对510nm光的吸光度(A)与浓度(C)呈良好的线性关系。
[目的]缓解北方地区粮草争地矛盾。[方法]2014~2015年在冀中南地区进行巨菌草引种试验,探索巨菌草在我国北方地区的适宜种植管理模式。[结果]当巨菌草株高在1.2 m左右时,巨菌
论述了对电磁感应现象本质的认识及其深化,探讨了准确全面地表述电磁感应定律的数学表达式.
介绍了土地利用与农田保护信息管理系统的软件设计思想,软件规格及使用说明。
对Van der Corput不等式进行了研究,并将其进一步改进如下:设an≥0,Sk=∑km=1(1)/(m),则∑∞n=1(∏nk=1)a(1)/(k)k)(1)/(Sn)≤e1+γ∑∞n=1e-(1)/(4n)(n-(1)/(3n)logn)an,其
热塑性树脂基复合材料具有韧性良好、可再次回收利用等优点,尤其是高性能热塑性聚合物的快速发展促进了热塑性树脂基复合材料在各项领域的应用,这也使得对热塑性树脂基复合材