XML压缩算法及二进制数据序列化研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zz727zz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经日趋成为一种流行的数据表示和交换标准,用于在不同的系统和平台之间提供中立的数据表示。但是,XML天生具有的数据冗余量大的特点。近年来,国内外针对XML文档的压缩都提出了一些算法。这些XML压缩算法都充分利用了XML文档在结构上的特点,将XML文档的结构和数据相分离,再对两部分进行单独压缩。本文分析了近年来流行的几种XML压缩算法的实现原理,通过实验对比了这些算法的表现。然后,从并行化的角度对这些算法的实现提出改进,考虑对各个容器的压缩同时进行,在实验中,我们对比了并行化实现和串行化实现的表现,考察并行化实现在时间效率上的改进,并对比了两种实现的内存使用情况。最后,对压缩算法的后端压缩进行改进。改进主要利用了近年提出的LZMA算法,在实验中,我们充分对比了用gzip和LZMA作为后端压缩器的XML压缩算法的压缩率。   本文同时也关注了另一大类重要的数据格式:二进制科学实验数据。科学实验的结果往往采用二进制形式保存。传统意义上,计算机中采用统一字节数表示特定的数据类型。近年来发展的序列化技术则采用紧凑编码的方式实现数据存储,可以有效地减少数据文件所占空间和传输时间。本文研究了这些序列化技术在压缩二进制科学数据文件方面的效果,同时也考察了这些序列化方法的执行效率。针对目前计算机的多核发展趋势,本文研究采用多线程技术改进这些算法的实现,以进一步提高算法的执行效率。最后,由于数据在网络传送中存在一定的安全性问题,本文将在分析已有安全性算法的基础上,提出一个可行的安全方案。
其他文献
本文以汉代画像石(砖)艺术中的叙事手法为主要研究对象,通过对画像石(砖)的艺术特色、主题表现和故事趣味性的讨论,分析其漫画化艺术特征;在此基础上,结合现代动漫艺术特点,
本论文系统地阐述了图像光学加密技术的发展和现状。简要介绍了光学全息技术、计算全息技术的发展及应用、空间滤波、菲涅尔衍射和夫朗禾费衍射、计算全息编码等基本理论与方
复杂网络是研究复杂系统的一门新的学科,这门学科融合了数学、统计物理、非线性动力学以及社会学生物学等学科。人类周围的许多系统都可以看做网络,比如交通网、电力网、人际关
科学探究是新课程改革的重要理念,又是重要的教学方式之一。培养学生质疑,探究的过程就是学生通过细心观察,精心分析到圆满解决问题的一系列有序活动。在教学中,我们应尽可能的创
音乐课是一门开发学生智力、陶冶学生情操、培养学生能力和提高学生素质的课程。有效的音乐课堂会让学生真心喜欢,沉浸在音乐带来的美好情境中。那么,怎样才能构建有效的音乐
通过弗朗西斯·培根的绘画、出身和成长环境等方面的了解,引出艺坛新秀艾德里安·格尼。然后再根据对比弗朗西斯·培根的绘画、出身和成长环境,得出培根与当代具象绘画艺术新
量子纠缠是量子信息学的核心,在量子计算和量子信息处理任务中具有广泛的应用。因此,如何实现快速、便捷的纠缠态制备就显得尤为重要。在众多物理系统中,线性光学系统始终是国内
高电荷态原子在各种等离子体环境的许多碰撞和辐射过程中都起着非常重要的作用。有关该领域的学科——高电荷态原子物理,一直是现代原子物理学中最活跃也是最有趣的领域之一。
江泽民创造性地运用和发展了邓小平党的建设理论,形成了一个完整的理论体系,为马克思主义建党理论增添了新的丰富内涵。 一、鲜明的时代性。江泽民关于执政党建设的理论适应
初中化学新课程标准指出:义务教育阶段的化学课程是科学教育的重要组成部分,应体现启蒙性和基础性。一方面,要提供给学生未来发展所需要的最基础的化学知识和技能,使学生从化