基于XML的半结构化数据存储和查询的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:a4936543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和www迅速发展,网络信息资源的动态性、分布性、多元性和无序性等特点,使信息的处理变得越来越困难。大量网络信息资源以半结构化数据的形式存在,如何用可靠的系统来存储和提供有效访问这些数据的需求也在逐步增加。XML数据模型与半结构化数据模型有着很多的相似性,可以说,XML是WWW 上的半结构化数据,它既为半结构化数据的研究提供了广阔的应用前景,同时也推动了半结构化数据研究的发展。为了充分发挥XML的技术特点,基于XML半结构化数据的有效存储和查询成为急需解决的关键问题。由于关系型数据库系统(RDB)具有强大和可靠的数据管理服务、高性能的查询优化,这些方面较其它系统远为成熟和稳定,自然地成为了解决这一问题的重要途径。 大量的研究关注了以关系型后台存储XML文档,提出了不少映射策略和查询转换算法。此外,商用的RDBMS也支持了XML数据存储。然而,现有的XML到关系型映射方法中仍存在着不足之处:关于映射策略的研究就很少提到查询转换,而且目前大量的存储映射方案都是针对特定的应用,很难移植到其它的应用中;如缺少扩展机制,很难重用;缺乏灵活性和一致性,尽管主要的关系数据库也提供了对XML的支持,允许对XML进行存储管理,但是它们都是私有的,映射策略比较固定,文档的分割和查询转换只能用于一个后台数据库。 本文对当前现有的XML数据存储和查询技术进行了深入地研究和探讨,对比分析了各种存储和查询技术的优缺点,适应场合和性能。在此基础上,本文提出了一种基于模式的xml数据映射方案,并据此设计实现了一个独立于后台的RDBMS的原型系统。 该方案对映射策略的选择是通过对输入的XML模式添加模式注释来实现,模式注释的设计集成了多种映射策略,通过添加不同的注释就可以自由组合使用各种不同的映射策略。通过模式注释结合一系列默认检验规则来保证映射的正确性和无损性。此外,方案还给出了显著提高XML数据导入性能的两种方法。 最后,用典型的实验对系统进行了功能与性能方面的测试,效果良好。
其他文献
DICOM标准是应用于医疗系统中医学数字成像及通信的国际标准,通过它实现不同厂家设备间的医学图像和其他相关信息的传输。基于DICOM标准的打印服务器可以在不增加任何接口设备
2000年后商业网站的热潮带动了校园网的发展。同时作为国内与互联网相连的最大的学术网络中国教育科研网(CERNET)的成功建立和运行,也对我国教育和科研事业的发展起着重要的
随着信息技术的快速发展,网络信息的高度膨胀,网络设备的发展速度远远赶不上信息的增长速度,因此网络传输过程中出现了大量的拥塞。如何提高网络资源的利用率,提高网络的整体
数字半调是指通过量化操作将连续图像转化为二值图像的技术,而逆半调是半调的逆过程,由半调图像重构成连续图像的过程称为逆半调。现实生活中我们往往只能获取半调图像,如果要对
基于构件的软件开发得到了广泛地应用,而构件系统的测试仍然面临着许多问题,本文主要对构件系统集成测试的测试用例生成进行了研究。构件系统测试和面向对象系统测试既有相似
随着计算机及Internet的发展,远程教育越来越受到人们的青睐。远程教育突破了传统教育在时间和空间上的局限,使学生在任何时间、任何地点都能够参加学习,共享优秀的教育资源
无线传感器网络是由大量具有特定功能的传感器节点通过自组织的无线通信方式,相互传递信息,协同完成特定功能的智能专用网络。由于其自身特点,无线传感器网络已在众多的领域中得
海上船舶自动识别系统(AIS)是一种采用TDMA方式工作的新型助航设备。其优点是信息量大、实时性好、抗干扰能力强和越障碍传输。主要应用领域是船舶避碰、船舶交通管理系统。
随着个人电脑以及互联网全世界范围内的普及,计算机游戏产业正作为一种新兴的产业迅速发展。有调查显示,到2007年,其市场总额将达到1000亿美元。因此,它被那些行业分析师认为将在
虚拟现实技术的应用现在越来越多,而虚拟场景则是虚拟现实的一个重要组成部分。本文首先介绍了虚拟现实的概念和国内外现状,然后介绍了目前比较流行的创建虚拟场景技术。接着