一种快速的非提取式XML解析器的设计与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:gg741852963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基于提取式XML解析模型,对非提取式XML解析模型的研究很少。VTD-XML是一种新型的非提取式XML解析模型。本文在VTD-XML的基础上设计并实现了一种快速的非提取式XML解析器,称为NEM-XML。首先,NEM-XML是一种非提取式XML解析器。它抛弃了XML DOM模型中为每个XML节点创建节点对象的做法,取而代之的是使用64位长的整数保存XML节点的元信息,极大地减少了解析XML文档所需的时间和内存空间。NEM-XML以静态链表的方式组织内部的数据结构,既方便了元素节点的添加和删除,又提高了XML文档的遍历速度。其次,探索了复用XML解析结果的方法,也就是在第一次使用XML文档时进行正常的解析并将解析结果保存到二进制文件中,以后使用时直接利用二进制文件还原原始的解析结果。这在那些仅对XML文档进行访问而无更新操作的应用中有很大的实用价值。为了复用NEM-XML的解析结果,本文改进了NEM-XML的数据结构,以减少保存解析结果所需的空间以及还原解析结果所需的时间。最后,并行计算是当前的一个重点研究领域,XML并行解析也得到了越来越多的关注。本文研究了NEM-XML的并行解析算法,提出了一种受限制的XML文档划分方法,可以很快地确定各个文档片段的初始解析状态。这个划分算法兼顾XML文档的层次结构和负载平衡,划分结果比较理想。本文对XML解析技术的研究具有一定的现实意义。它不但扩展了VTD-XML所体现的非提取式XML解析思想,还进一步研究了如何复用NEM-XML的解析结果,可以促进XML在各个领域的应用。另外,本文提出的受限制的XML文档划分方法对其它XML并行解析方面的研究具有一定的参考价值。
其他文献
信息技术的高速发展使人类社会大步迈入了网络时代,既有人们日常生活离不开的大型电力网络和交通网络,更有用于获取知识信息的Internet网络,万维网以及科研合作网络,人们已经生
Internet的高速发展和新型网络服务的出现,要求防火墙、安全网关等网络设备具有更强的数据处理能力。流分类能有效支持全方位的网络服务、提高网络设备的性能,是高速网络的关
随着新型网络业务、网络协议以及多核技术的发展和成熟,具有高速业务处理能力、高可编程性、基于多核处理器的网络分组处理端系统,成为学术界和工业界研究的热点。一方面,通
无线传感器网络(Wireless Sensor Network,WSN)是基于任务驱动的自组织系统,密切关注用户需求,通过中间节点大量传输数据。由于暴露在外部区域,时常会遭受恶意的攻击等危险行
防抱死制动系统(ABS)是在汽车制动过程中防止车轮抱死的闭环控制系统,最开始应用于火车和民航机上,现如今已经越来越广泛的被汽车所应用。ABS关系到汽车制动过程中的主动安全
图像半调技术和逆半调技术是图像处理技术的一个边缘分支。将噪声植入连续图像,变为二值图像的过程称之为半调过程,其逆过程称为逆半调过程。查找表法是逆半调技术众多方法中
随着电子书阅读器市场的成熟,电子书阅读器的功能也越来越强大,拥有了像WIFI,3G这样的高速网络通讯工具,因此要求各种各样的网络应用程序,像浏览器,邮件客户端等基础网络应用
随着计算机科学与技术的发展,计算机被应用到各行各业。决策支持系统(DecisionSupport System,简称DSS)越来越被人们重视,决策支持系统的模型系统也同样受到人们越来越多的重视
随着服务计算与云计算的发展,互联网上发布的Web服务数量也在迅速增长,通过调用不同的Web服务来快速搭建有创意的Mashup应用,引起了服务开发者的广泛兴趣,而如何帮助用户快速
近年来,在企业级应用开发环境中,面向对象的开发方式已成为主流,而关系数据库是目前使用最广泛的数据库,因此,在开发过程中通常会采用面向对象技术和关系数据库相结合的方式