ERP系统中XML压缩算法的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:chinaoristand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
市场全球化的趋势使得市场竞争日益激烈,跨行业、跨区域的企业制造模式已经逐渐形成。作为一种跨平台、网络化、服务于企业的企业建模和管理工具,ERP(企业资源计划)的概念于1990年被提出。ERP系统集信息技术与先进的管理思想于一身,成为现代化企业的运行模式,为全球企业所广泛应用。在ERP系统中,数据的异构会导致数据加载的困难,因此ERP中的A2A和B2B数据交换往往采用XML作为数据载体。   本文从ERP系统中XML数据量大的角度出发,针对XML文档集之间和文档内部的结构冗余所带来的网络通信带宽问题,对ERP环境下的XML压缩算法作了分析和研究。   首先分析了现有的XML压缩算法技术,包括不支持查询的XMill算法以及支持查询的XGrind,XPRESS算法等。针对ERP的应用,提出一种支持查询的自适应XML压缩算法LXMLZIP算法。   LXMLZIP算法是基于Lempel-Ziv编码,同时借鉴了前缀的思想,将文档结构和文档数据分离进行编码,采用了同构转换的策略,使得压缩后的文件在结构和语义上都与原始XML文档等同。算法对文档的数据部分,采用数据类型相关的压缩算法。该算法分为解析器,分类器以及适应各种不同类型的编码器组成。解析器将解析XML文档为结构信息和数据信息。对结构信息直接使用基于Lempel-Ziv编码进行压缩,对数据信息使用分类器,进行正则匹配,针对不同类型的数据采用不同的编码方法进行压缩。通过尽可能得将同种类型的数据进行压缩编码,可以大大得提高压缩率。而结构信息和数据信息同时进行压缩,将节省了压缩的时间。   此外,为了改进压缩算法依赖于DTD图,还提出了一个改进算法,该算法将结构信息保存于结构容器中,利用XML数据的结构冗余,二次扫描压缩XML文件,以提高压缩效率。   论文最后给出了实验结果,同比于其他压缩算法来说,LxMLZIP压缩算法在处理结构复杂的XML文档效果会差一些,压缩的时间以及内存损耗有所提高;改进的压缩算法则在压缩效率上有很大的提高,适合更加广泛的应用。两个压缩算法的整体压缩率都保持在50%以下,总得来说,实现的XML压缩算法在现实应用中,是符合设计要求的。
其他文献
嵌入式系统广泛采用Linux作为操作系统,它们大多数直接由标准的Linux移植过来,其内核的存储管理子系统对嵌入式系统硬件平台的可剪裁性支持有限,特别是没有专门针对众多无硬盘典
本文通过对目前比较流行的三维人脸动画技术的研究,提出了一种基于文本和语音驱动的人脸表情动画算法的实现,并拟将该算法运用到三维虚拟教学环境之中。通过虚拟教师面部表情的
随着电信网、互联网和广电网业务的发展,家庭用户的市场需求呈现出媒体互动化、业务多样化和终端综合化的特点,在国家信息产业“三网融合”战略的推进下,家庭手机屏、PC屏、T
随着当前网络技术的发展,数字图书馆拥有越来越庞大的数据资源,然而广大用户可能难以确定有效的检索词来获取需要的资源。针对上述问题,本文以国家“211”工程“中国高等教育文
目前,我国的电力设计行业在项目管理中还存在很多问题,其中最关键的问题就是工程设计流程不够完整和规范。对电力设计流程进行规范化建模和分析是提高电力设计效率的关键。Petr
近些年来,各种信息处理系统和互联网快速发展,大量的数据随之产生。如何从这些数据中发现有用的知识就变得非常重要,因此,数据挖掘在近些年是热点研究领域。而在数据挖掘研究中,聚
在开放的互联网环境中,面向服务的计算(Service-Oriented Computing,SOC)和面向服务的体系架构(Service-Oriented Architecture,SOA)使得信息资源和软件系统的主要形态发生了巨
增强现实技术(Augmented Reality)是指将计算机产生的虚拟对象放置到反映真实世界的场景空间中,并对真实世界起到补充,增强的作用的一种新兴技术。本文提出了一种可应用于机器
网络信息抽取是指从半结构化的html网页中,抽取出正文、作者、时间等关键信息。网络信息抽取是包括搜索引擎、舆情系统、推荐系统等在内的数据分析系统的基础支持技术,用于从采
P2P网络具有很高的可扩展性、自治性和容错性,能充分利用个人电脑的网络带宽、存储空间以及计算资源,为构建文件共享和存储系统提供了非常有利的条件。但由于系统用户具有高度