【摘 要】
:
XML文档的应用日益广泛,而其中的XML解析技术是XML应用的关键。如何正确、高效地解析XML数据非常重要,尤其是对于要处理大量数据的应用程序。不合适的解析会导致过度的内存消
论文部分内容阅读
XML文档的应用日益广泛,而其中的XML解析技术是XML应用的关键。如何正确、高效地解析XML数据非常重要,尤其是对于要处理大量数据的应用程序。不合适的解析会导致过度的内存消耗和过长的处理时间,从而有损于可伸缩性。本文首先介绍了XML解析技术的研究动向,从结构、工作原理方面研究了当前两种发展比较成熟的XML解析技术—DOM和SAX,并分析了它们各自的优缺点。在分析这两种解析技术弊端的基础上研究探讨了一种新的基于虚拟令牌符的非抽取式解析技术——VTD-XML,其很好的克服了DOM和SAX的弊端,并通过巧妙的设计结合了两者的优点,大大提高了XML解析效率。其次,通过实验将VTD-XML与DOM、SAX进行比较分析,验证了VTD-XML在解析速度、内存使用以及导航性方面的优势,在对VTD-XML的设计原理和解析方法进行深入剖析后,针对大型XML解析,提出了基于VTD扩展的改进方案,并通过实验验证了方案的可行性。最后,将VTD-XML解析技术应用到教学平台中的Office文档处理中,提高了处理效率,改善了教学效果。
其他文献
不确定数据是近年来在传感器网络(WSN)、无线射频识别(RFID)等领域中涌现出来的一类新数据,对不确定数据聚类分析已经成为数据挖掘领域研究的新热点。本文阐述了数据不确定性
随着网络学习资源的海量级增长,加之不同用户背景知识和兴趣爱好各异,信息需要不尽相同,传统的基于关键字匹配的信息检索技术无论从资源覆盖率、检索精度等诸多方面来看,都无
最近十年以来,移动互联网得到了快速的发展并产生了巨大的变革,也引发了各种移动设备的快速普及。同时移动设备上的各种应用也在不断的丰富和改变着我们的生活。在各类应用中
近年来,随着生物技术,尤其是高通量技术的发展,生物网络数据有了显著的增长,出现了很多的生物网络数据库,包括蛋白质反应网络,新陈代谢网络,基因调控网络,神经网络等,如何从这些浩瀚的
面向服务的体系结构(Service-Oriented Architecture, SOA)是一个组件模型,它的主要作用就是将应用程序的不同业务功能(即服务)通过服务之间定义良好的接口联系起来,然后通过
由于人们对信息安全的逐步重视,加解密技术一直是研究的热点。各种加密算法相继问世,但加解密算法的安全性与复杂性始终是两个不可调和的矛盾体,在加解密速度和安全性上无法
源于人工智能领域语音处理技术的飞速发展,人们希望可以和机器进行更自然、贴切的交流。语音情感识别是继语音识别之后,人机交互中的又一热点问题,得到了研究者们广泛的关注
随着现代社会的快速发展及互联网应用越来越广泛,每天所产生的信息量也在急剧的增加,特别是网络数据每天都在指数倍的增加。面对这些实际存在的数据,如何从中获得对人们有用的知
随着虚拟集群中虚拟机数目的增加,单个虚拟机的出错往往会使得整个虚拟集群失效的概率也随之增加。因此,提高虚拟集群的可靠性,为其提供容错支持,在错误发生时保证程序运行的
随着计算机技术及人工智能的发展,计算机组卷系统的研究逐渐被越来越多的专家学者所注意,一套计算机组卷系统能够让教师在较短的时间内轻松完成试题的选择,组卷,排版等工作。