论文部分内容阅读
可扩展标记语言(eXtensibleMarkupLanguage,简称XML)是一门新兴的面向Internet应用的标记语言,目前已迅速发展成为Web和数据交换的一种新标准。XML数据的海量出现使得如何有效地对XML数据进行存储和管理成为研究热点。利用现有关系数据库的存储管理、并发控制、恢复、版本机制等技术可以有效地存储和管理XML数据。
本文首先介绍了XML的相关技术领域,对XML文档的各种存储方法作了一些简要比较,并着重研究了XMLDTD到关系模式的映射。通过分析有关XML关系存储的经典算法可以发现,现有的XML到关系数据库的映射算法大多只考虑内容和结构的映射,而很少考虑XML所蕴含的语义。然而语义信息对于数据的存储模式设计、查询优化和更新异常检查等问题是十分重要的,因此如果DTD中蕴含函数依赖,在进行映射时予以考虑可以带来很多便利。
本文试图提出一种保持函数依赖的映射策略,在进行内容和结构映射的同时保持函数依赖。依据XML函数依赖定义,找出DTD中所蕴含的函数依赖,最终利用改进的内嵌算法FD-Inlining实现了从XML到关系数据库的保持函数依赖的映射。FD-Inlining方法不仅考虑了DTD的内容和结构,还考虑了DTD所蕴含的函数依赖,对DTD中蕴含的其它语义约束也进行了分析,给出了保持部分语义约束的方法。最后对本映射策略的完整性进行了分析。