文本压缩相关论文
作为信息交换和发布的标准数据格式,近年来XML已经得到了广泛应用.如RSS(RDFSiteSummary)技术,它是一种以XML为标准进行站点之间共......
为了解决车辆导航系统中大量兴趣点名称的拼音词串的存储问题,对英文字母词的可压缩性进行了分析,发现了英文字母词的词头特性,设......
研究汉语文本自适应压缩算法还是探讨汉语文本自适应模型的有效途径.汉语文本自适应模型是汉语分词、汉字识别、词性标注和文本自......
该文从面向大规模真实文本的角度出发,初步介绍并讨论了大规模真实中文文本的处理技术和特点:首先,在文本表示方面,该文采用向量空......
近几年来,XML已经成为Internet上数据表示、交换和存储方面的标准,为数据库的应用开辟了一个崭新的领域,然而由于XML数据的半结构......
随着“互联网+”概念的提出,互联网的应用在我国越来越广泛,人们对知识的渴望越来越强烈。但是目前海量的信息充斥在网络各个角落,......
为了解决传统的LZSS压缩算法在进行文本压缩时存在的问题,提出了前缀编码,可变窗口以及游程编码的算法思想对其进行改进。通过测......
该论文所提出的一系列中文文本压缩算法的特点就是对中文文本的压缩效果好,并且解压缩算法简单、容易实现.有利于应用在嵌入式系统......
本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编......
基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型,但是它的最优符号集的寻找算法是NP完全问题,本文提出了一种基于贪心......
基于单词的文本压缩算法是一种新型的算法,它与传统文本压缩算法的主要区别是以单词取代单个字符作为处理对象,介绍了基于单词的Huff......
随着信息量的不断增加,用计算机处理的文本文件越来越大,需要对庞大的藏文文本进行数字化处理,如何节约资源对藏文文本进行高效压缩显......
该文根据中文文本的特征对LZW算法从哈希函数、基本码集和更新策略三方面进行修改,得到的LZWCH算法对以中文为主的中西混合文本的压缩比平均......
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串.从而达到更好的文本压缩......
随着藏文信息处理技术的发展,藏文压缩也成了必不可少的一门研究内容。但是目前的研究成果只有一个,然而现实环境中需要一个适应于......
本文分析了LZ77和LZ78算法在文本压缩中各自的长处和不足,以它们的实用算法LZSS和LZW的中文文本改进算法LZSSCH和LZWCH为基础,设计......
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语......
本文讨论了文本压缩的几种模式及常用技术,介绍了两种新的文本压缩方法——算术编码法和LZ字典压缩方法。分析了中、英文文本之间......
互联网上绝大多数文本数据都由HTML、JavaScript和CSS写成。这些格式大多不能采用有损压缩,因而其压缩率通常不及可失真图片或视频......
张进(武汉大学图书情报学院湖北430072)论文本压缩技术的发展AbstractAfterclasifyingthecurrentful-textcompressionmethods,theanthorpre-sentsmodifiedHufmanc.........
PPM算法在文本无损压缩方面具有比LZ算法更高的压缩率。PPM算法分建模和编码两步,在建模时有两种方法选择上下文模型,一种是固定最大......
This paper presents a description and performance evaluation of a new bit-level, lossless, adaptive, and asymmetric data......
为了提高Symbian S60数据库中文本数据存储的效率,同时使数据库应用具有良好的响应速度,在研究该类数据库的特点和"字典码"压缩算......
提出了针对整数数据的CSN-2压缩算法,并将其应用于任意文档的压缩,且CSN-2压缩算法不需额外的数据支持。通过研究CSN-2解压算法,提......
为了节约大学英语移动学习系统中的网络开销成本,提出一种适合当前网络传输状况的文本传输算法就变得十分必要。结合当前的无损压......
简要评述了自动摘要的文献 ,介绍了一个基于句子选择的自动文本摘要系统 ,分析了该系统的运行 ,指出这种方法对于自动文本摘要的意......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
概述了数据压缩的起源及分类,并且对其中的一个重要组成部分--文本压缩的各种压缩算法:Huffman编码,算术编码,LZ系统算法等进行分......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
该文把GB2312-80的汉字转换为从0至6767的短整型数,这些短整型数据有一个共同的存储特点:它们的2字节中的高3位(称为冗余位)皆为0. ......
文章针对通过RSA加密技术生成防伪二维码过程中,因加密数据信息过大而导致的防伪信息生成效率低下的问题,提出对加密文本进行前置......
随着互联网、网络流媒体技术和多媒体信息检索的发展,图像和视频已成为当前多媒体信息交流和服务的主流信息载体。第四代(4G)数字......
在信息快速传输和存储的过程中,数据压缩有着非常重要的作用。介绍了基于哈夫曼树的文本压缩和解压缩的原理与方法,并给出了Huffma......
提出了基于综合方法的主题句的提取方法,并着重讨论了文本主题概念的提取以及相应的权值体系.根据概念间的相互关系,对同义概念进行语......
近几年来,以Android为首的移动智能终端数量以惊人的速度增长,同时作为传统通信手段的短消息得到了更好的继承和发展。然而面对新......
为了理解高效的文本压缩算法,探究文本压缩的原理和意义,对基于BWT的字符串轮转理论进行了深入的理解;游程编码作为一种简单有效的......