论文部分内容阅读
XML以其强大的数据表达能力,事实上已经成为Internet上数据表示和交换的标准。由于关系数据库仍然是大多数商用数据的存储手段,因此将关系数据发布成XML成为数据库领域的重要研究方向。
将关系数据发布成XML,需要定义两者之间的映射关系。由于XML和关系数据结构上的巨大差异,以及实际应用中XML规模的庞大,定义映射关系的工作往往很复杂。本文提出一种自动生成映射关系的算法,根据给定的关系库和DTD,利用两者之间的语义关系,推导出映射关系。该算法能显著减少定义映射关系的工作量,并可直接应用到后续的发布工作。
在实际应用的发布中,关系数据随着时间的推移会发生变化,于是发布的XML也应该作相应的更新。当原XML文件很大,而变化的部分的数据量很小的情况下,将XML重新发布的策略将导致大量计算都用于生成已有的XML文档。本文提出一种增量更新的算法,算法中只需要保存当前路径和XML的DTD。因此内存开销和XML文档的大小无关,适用于大数据量的XML的发布。
最后,本文还实现了一个基于关系数据库的XML发布系统,它是国家863项目‘web数据库新技术”中的一部分。