基于关系数据库的XML存储、查询与重构

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qiwa99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language,可扩展标记语言)为网络传输提供了一种便捷有效的数据格式,它是一种自描述的标记语言,能提供统一的数据说明方式,可以描述任意数据逻辑关系。XML很快成为了Internet上数据表示、集成和交换的标准,同时也促进了下一代网络的发展。如今,互联网上急剧膨胀的XML数据带来了一个全新的研究领域——XML数据管理。而借助关系数据库来管理XML数据是其中一个热门研究方向,这种方法可以利用关系数据库成熟的技术,例如内存管理、查询服务、并发控制、数据恢复、访问控制及安全性等。然而具有层次和嵌套的XML数据模型比二维平面式的关系模型复杂得多,要使用关系数据库无损地存储和管理XML数据是一项十分困难的任务。论文的目的是设计并实现一种通用的基于关系数据库的XML数据管理系统,使之能有效应用于电子商务等领域。使用关系数据库管理XML的方法一般需要完成三个步骤,论文分别针对这三个阶段作了一系列工作:(1)模式映射——利用XML模式信息生成关系模式以存储遵从该模式定义的所有XML文档。论文首先提出一种改进的共享内联技术,它增加了DTD简化规则,并定义新的DTD图模型和内联DTD图模型。基于这些模型,模式映射算法DTD2RSchema将DTD转换成对应的关系模式和σ映射。(2)文档映射——将XML文档存储到关系数据库中。为表示XML文档,首先定义一种XML树模型,文档映射算法SAXDocMap自顶向下遍历XML树为每一个结点编码,同时利用σ映射将结点信息映射到关系元组中。(3)查询映射——将XML查询转换为关系查询,并在需要时将关系查询结果重构成XML子树。在路径匹配阶段,定义一种断环DTD图来管理DTD中存在的递归环路,利用这种断环DTD图,路径匹配算法PathMatching可有效地找出递归查询的所有匹配路径;在查询转换阶段,转换算法Convert2SQL以匹配路径为输入并生成等价的SQL查询;在XML重构阶段,首先通过算法SESGen生成结构编码序列,再由重构算法ReconXML将结构编码序列还原成XML文档。所有算法都已在XML存取原型系统X2R中实现。论文最后以MySQL作为后台数据库从不同角度对X2R进行测试和验证。实验证明,X2R能够无损地存储XML数据,且具有良好的可扩展性和高效的查询性能。
其他文献
人群仿真技术在虚拟现实中的地位越来越高。在公共安全领域、环境工程、交通工程和社会学等的仿真研究中,人群行为模型的作用越来越突出;计算机游戏动画、电影制作、大型场地表
根据现代社会对事务处理高效、便捷的要求,传统纸质选举方式已经满足不了现代选举的需求,计算机技术飞速发展以及网络环境的完善,使得以计算机网络技术为基石的电子投票应运
在嵌入式领域中,嵌入式实时操作系统正得到越来越广泛的应用。由于8位单片机本身资源的限制,以前很少有在8位机上运行的操作系统,随着8位机功能和资源的增加,渐渐出现了不少
随着Internet应用的日益普及,尤其是在Internet上提供大量的商业服务和大规模信息处理,人们对计算机系统的处理能力和可用性都提出了更高的要求。为避免因故障导致的停机和服
传统中药贴剂产品生产中设备自动化、工业化程度低,常采用人工检测的方法对贴剂的厚度进行采样测量,劳动强度大,生产效率低。基于图像传感器的厚度检测具有非接触、在线检测
三维重建技术是数字图像处理和机器视觉领域的重要研究方向,随着信息技术的飞速发展和三维相关需求的增多,三维重建的定义也不断完善和创新。通过对二维图像的信息提取和关键
随着计算机图形技术的不断发展,人们已经能够使用计算机实现“照片级”真实的虚拟环境。为了进一步提升虚拟环境的沉浸感,环境的可交互性成为现阶段的研究热点。随着物理模拟
中医脉象学历史悠久、内容丰富,是我国传统医学中最具特色的一项诊断方法。脉象是医生切脉时手指感觉到的脉管搏动的形象,是一项灵敏度较高、综合性较强的人体生理、病理信息
研究表明软件缺陷多集中存在于较少的模块中,这些缺陷在模块间的传播成为影响软件质量的重要问题。目前对缺陷传播影响的研究多应用在较小规模的软件系统中,对较大规模软件系
平面上几何物体序列遍历问题是计算几何学研究领域的核心问题,它不仅涉及可视性识别、最短路径计算、算法设计与优化等基础理论问题,而且也是机器人运动规划、无人机控制等一