一种快速的非提取式XML解析器的设计与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户：gg741852963

【摘要】

：

随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基

【作者】

：

张运嵩

【机构】

：

苏州大学

【出处】

：

苏州大学

【发表日期】

：

2010年期

【关键词】

：

XML解析 VTD-XML 非提取复用性并行计算

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基于提取式XML解析模型,对非提取式XML解析模型的研究很少。VTD-XML是一种新型的非提取式XML解析模型。本文在VTD-XML的基础上设计并实现了一种快速的非提取式XML解析器,称为NEM-XML。首先,NEM-XML是一种非提取式XML解析器。它抛弃了XML DOM模型中为每个XML节点创建节点对象的做法,取而代之的是使用64位长的整数保存XML节点的元信息,极大地减少了解析XML文档所需的时间和内存空间。NEM-XML以静态链表的方式组织内部的数据结构,既方便了元素节点的添加和删除,又提高了XML文档的遍历速度。其次,探索了复用XML解析结果的方法,也就是在第一次使用XML文档时进行正常的解析并将解析结果保存到二进制文件中,以后使用时直接利用二进制文件还原原始的解析结果。这在那些仅对XML文档进行访问而无更新操作的应用中有很大的实用价值。为了复用NEM-XML的解析结果,本文改进了NEM-XML的数据结构,以减少保存解析结果所需的空间以及还原解析结果所需的时间。最后,并行计算是当前的一个重点研究领域,XML并行解析也得到了越来越多的关注。本文研究了NEM-XML的并行解析算法,提出了一种受限制的XML文档划分方法,可以很快地确定各个文档片段的初始解析状态。这个划分算法兼顾XML文档的层次结构和负载平衡,划分结果比较理想。本文对XML解析技术的研究具有一定的现实意义。它不但扩展了VTD-XML所体现的非提取式XML解析思想,还进一步研究了如何复用NEM-XML的解析结果,可以促进XML在各个领域的应用。另外,本文提出的受限制的XML文档划分方法对其它XML并行解析方面的研究具有一定的参考价值。

其他文献

复杂网络的社团结构划分方法及其研究

信息技术的高速发展使人类社会大步迈入了网络时代，既有人们日常生活离不开的大型电力网络和交通网络,更有用于获取知识信息的Internet网络，万维网以及科研合作网络，人们已经生

学位

复杂网络社团结构聚类分析Normal矩阵

流分类算法及其应用研究

Internet的高速发展和新型网络服务的出现,要求防火墙、安全网关等网络设备具有更强的数据处理能力。流分类能有效支持全方位的网络服务、提高网络设备的性能,是高速网络的关

学位

流分类分组映射UTM网关Netfilter

基于端系统的分组IO加速技术应用研究

随着新型网络业务、网络协议以及多核技术的发展和成熟,具有高速业务处理能力、高可编程性、基于多核处理器的网络分组处理端系统,成为学术界和工业界研究的热点。一方面,通

学位

端系统多核流亲和链式发送TLB

无线传感器网络中基于数字水印的数据安全保护

无线传感器网络(Wireless Sensor Network,WSN)是基于任务驱动的自组织系统,密切关注用户需求,通过中间节点大量传输数据。由于暴露在外部区域,时常会遭受恶意的攻击等危险行

学位

无线传感器网络数字水印校验码数据安全

基于整车的汽车ABS性能仿真检测研究

防抱死制动系统(ABS)是在汽车制动过程中防止车轮抱死的闭环控制系统,最开始应用于火车和民航机上,现如今已经越来越广泛的被汽车所应用。ABS关系到汽车制动过程中的主动安全

学位

汽车ABS制动性能仿真检测路面模型车辆动力学模型

图像逆半调技术中查找表模板优化方法研究

图像半调技术和逆半调技术是图像处理技术的一个边缘分支。将噪声植入连续图像,变为二值图像的过程称之为半调过程,其逆过程称为逆半调过程。查找表法是逆半调技术众多方法中

学位

查找表图像逆半调差分进化算法模板选择结构相似度

基于类纸阅读的图形界面平台实现与优化研究

随着电子书阅读器市场的成熟,电子书阅读器的功能也越来越强大,拥有了像WIFI,3G这样的高速网络通讯工具,因此要求各种各样的网络应用程序,像浏览器,邮件客户端等基础网络应用

学位

电子纸Qt平台延时刷屏多点触摸

决策支持系统中的模型选择研究——决策树分类算法

随着计算机科学与技术的发展，计算机被应用到各行各业。决策支持系统(DecisionSupport System，简称DSS)越来越被人们重视，决策支持系统的模型系统也同样受到人们越来越多的重视

学位

决策支持系统决策树算法平衡度系数分类算法

Web服务关系挖掘及应用研究

随着服务计算与云计算的发展,互联网上发布的Web服务数量也在迅速增长,通过调用不同的Web服务来快速搭建有创意的Mashup应用,引起了服务开发者的广泛兴趣,而如何帮助用户快速

学位

Web服务服务关系Mashup流形排序服务分类

基于Hibernate的对象持久层的设计和性能的提升

近年来,在企业级应用开发环境中,面向对象的开发方式已成为主流,而关系数据库是目前使用最广泛的数据库,因此,在开发过程中通常会采用面向对象技术和关系数据库相结合的方式

学位

持久层对象持久化Hibernate对象—关系映射性能优化缓存

一种快速的非提取式XML解析器的设计与实现

与本文相关的学术论文