XML文档的有效性验证和查询实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:cuitlcm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language)是W3C定义的一种标记语言,目前已被广泛用于电子商务、B2B通信、企业信息集成和Web服务等应用中,成为网络环境下组织、存储和交换信息的基本方式之一。随着XML应用的范围越来越广,对于XML解析的性能要求也越来越高。   本文在已有的ONCE XML Parser的基础上,研究了基于DTD(DocumentType Definition)的有效性验证和XML查询语言的特点,实现了支持基于DTD的有效性验证和遵循XML Path Language1.0规范的文档查询功能的ONCE XMLProcessor1.0。在设计上,ONCE XML Processor1.0采用了轻量级系统架构和有效实用的数据结构和算法,使系统具有良好的可配置性和可扩展性。同时,ONCEXML Processor1.0在系统结构、实现流程和语言层级等多个方面进行了性能优化,通过采用基于统计规律的策略、优化的自动机实现和合理的资源分配等措施,提高了系统的性能。   ONCE XML Processor1.0的有效性验证完全通过了W3C提供的XML/API兼容性测试,针对两千多个XML测试文档,我们的测试程序自动地测试ONCEXML Processor1.0中对有效性验证的处理是否符合XML规范。基于SUN提供的XML Test1.1测试包,ONCE XML Processor1.0中的有效性验证性能比Xerces2.9.0和Woodstox3.2.0平均高出40%左右。同时,ONCE XML Processor1.0的文档查询实现也通过了规范的功能正确性测试,性能较Xalan-J-2.7.0均快2倍以上。这说明,ONCE XML Processor1.0在保证功能完整的情况下,还具有高效的XML文档处理性能。
其他文献
Peer-to-Peer(P2P)网络在近年来受到了越来越广泛的关注,以P2P为基础的文件共享、即时通讯和网络视频直播已成为Internet上的主流应用。P2P网络的广泛使用为网络规划、网络安
学位
层次式交换网络是一种适应下一代互联网的基于IP交换的新型网络体系结构,它按照层次构造网络拓扑,地址空间与拓扑结构严格匹配,以交换代替路由,克服了现有Internet的一些缺点。目
学位
门户能够有效地实现异构信息之间的集成与协作,并为用户提供可定制、统一且遵循规范的访问服务。随着信息化建设的深入,门户已经成为企业构建新型办公环境的重要信息化工具。伴
学位
软件测试是软件生命周期中不可缺少的一部分,是保证软件质量的重要途径。“早测试,常测试,自动测试”已成为软件工程师公认的至理名言,其中由于自动测试能够降低测试成本,并且可以
学位
自动微分方法以较小的代价计算函数的导数,它在导数计算时间和计算精度等方面具有传统有限差分方法无法比拟的优越性。如今,自动微分方法在许多依赖导数的各种非线性数值算法中
学位
大数据时代的来临,用户面临严峻的信息超载问题。信息推荐技术能够帮助用户从海量网络信息中提取有用信息,因而得到研究者的广泛关注。但现有的推荐技术主要考虑从兴趣的共性
纹理合成技术能基于小纹理生成视觉上相似的大纹理,它在计算机图形学及计算机视觉中有很广泛的应用。例如,大规模场景的绘制通常需要大量的纹理来丰富其细节表达,如果直接使用大
学位
Web缓存技术是Internet环境下减轻Web服务器负载、缩短用户访问延迟、提高Web访问性能的有效方法。在移动计算环境中,由于受设备和网络的限制,缓存策略的设计必须权衡性能收益
学位
社区宽带综合业务网络系统是以交换式以太网技术为基础的用户驻地网系统,它以一个计算机网的建设成本,实现了电话网、电视网和计算机网三网业务融合。以太网交换机是该系统的核
学位
H.264是目前应用最广泛的视频编码标准,它的码率控制算法JVT-G012是一种优秀的码率控制算法,但依然存在很多缺陷。在为基本单元分配目标比特数时,仅考虑到缓冲区的状况,没有考虑
学位