论文部分内容阅读
HTML 作为 Internet 上传统的描述语言,随着网络应用的深入其局限性逐渐显现,XML 已经成为互联网上数据表示和数据交换的标准格式。随着 XML 数据的增加,如何有效地存储和管理 XML 文档成为一个非常重要的问题。目前主要的存储方法有:XML 原生数据库、面向对象数据库、关系数据库等。关系数据库由于技术成熟、应用广泛成为目前研究的热点。早期大多数研究是基于DTD模式开展的,但DTD缺乏对文档结构、属性、数据类型等约束的足够描述。另外由于 XML 数据和关系数据在组织上的差异,对于多值元素、递归元素以及混合内容元素的映射等难点问题也一直没有得到有效的解决。
因此,本文开展了基于XSD模式的XML文档到关系数据库的存储技术研究。论文的主要工作包括:
(1)在借鉴基于代价的P-Schema存储模型的基础上,提出了E-Schema存储模型。E-Schema是与XSD等价的XML模式文件,主要对P-Schema从以下方面进行改进和扩展:一是消除了多值元素、可选择元素、嵌套元素;二是保留了约束信息,如关键字、唯一性等等。
(2)实现了从E-Schema到关系模式的映射和 XML 文档到关系数据库的存储。E-Schema因为结构简单,保留了约束信息,因此可以更加容易、更加准确地映射到关系模式。
最后从实验上证明了E-Schema的可行性和有效性。