论文部分内容阅读
随着计算机和网络技术的不断发展,XML技术的应用也不断扩展。该技术不仅可以用于银行之间进行数据交换、证券公司对其上市公司相关的数据进行统计、图书馆对其馆藏书目进行查询检索、企事业单位对其文件档案进行管理,还可用于电子商务、搜索引擎软件、自动智能翻译、数字出版等领域。XML技术在当前的互联网络和IT环境中扮演越来越重要的角色,它事实上已经成为数据交换的标准、SOA架构的基石。XML的广泛应用使得高效的XML数据管理成为一种迫切的需求。 目前流行的XML管理系统可以分为两种类型:支持XML的数据库系统和纯XML数据库系统。支持XML的数据库,其特点是在不变动关系型数据库内核层的基础上,将XML的树型结构数据拆散、重组转换成关系型表格数据存入数据库。在提取XML数据时,利用SQL语言的优化将库内的表格型数据取出并还原成XML结构型数据。目前,主流数据库厂商的产品都提供了对XML的支持,包括Oracle,DB2,SQL Server等。纯XML数据库,如:MarkLogic、DBDOM、dbXML、OrientX等。其特点是以自然的方式处理XML数据,纯XML数据库系统能够保持XML数据的树型结构,可以将节点或者子树作为存储单元,针对XML数据存储和查询特点专门设计适用的数据模型和方法。 考虑到已有这么多的XML数据库系统被开发出来,有必要设计一套全面的评测基准。本文借鉴已有的XMark评测基准和TPox评测基准,设计了一个完善的XML数据库测试基准XBench。XBench中实施了大量的测试用例。其中功能测试部分设计了1210个用例,用来测试各系统对标准查询语言的支持程度。性能测试包括了存储、索引、查询处理、关键词查询、事务和并发、数据库安全、恢复和备份等方面。最后本文选取三个有代表性的数据库系统(MarkLogic Server,Oracle XML DB,Sedna)进行了测试和分析,并给出当前系统的不足之处。本文的贡献可概括如下: 1.设计了一个完善的XML数据库测试基准XBench,能全面的对XML数据库系统进行分析、对比。 2.根据XBench测试基准对选取的三种XML数据库系统进行测试,并针对各部分进行了对比分析,希望能为用户选择合适的XML数据库系统提供参考。 3.分析了国产XML数据库系统商业化必要性和可行性。为国产XML数据库系统商业化提供参考。