论文部分内容阅读
WWW上产生的海量XML数据已经成为现有关系数据库管理系统(RDBMS)的一个巨大挑战.由于传统的RDBMS主要为结构化的二维表数据而设计,因此它们很难胜任许多基于XML的、半结构化的、以文档为中心的应用,如数字图书馆、电子商务、电子政务等.目前有两大类XML文档:以数据为中心的和以文档为中心的XML文档.以数据为中心的XML文档有相对规则的数据集和结构.这些数据有很好的粒度,很少或没有复杂和嵌套的内容,因此他们适合于纯粹的数据交换和传输.
为了有效地存储和管理数字图书馆中海量的XML数据,XML数据库系统的选型和评估非常重要,因此我们设计和开发了一个XML数据系统的评测环境——TH-Xmark。其研究内容和目的包括;基于数字图书馆中海量的XML文档作为试验数据,评估XML数据库系统的性能指标,分析实际的和潜在的系统瓶颈,通过比较现有的两大类XML数据库系统的性能和功能上的优势和劣势,为数字图书馆等以文档为中心的应用提供方法和技术上的指导。