关系-XML数据库管理系统COSQL RX中SQL风格的XML查询处理的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:toneygao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML数据量的不断增加,提出了XML文档的不同存储方法。目前存在的XML数据的存储模式主要可以分为两类:关系存储模式和native存储模式。虽然我们将XML存于数据库当中,但目前的DBMS中XML查询引擎与关系查询引擎仍然是两套不同的机制,这就为统一处理带来种种不便;另外,由于XML数据结构的多样性,而当前的XML查询方法又都基于路径,依赖于特定的XML结构,这就给用户的查询就带来了很多困难,而关键字查询技术虽然方便构造查询,但目前的研究方法或者没有考虑查询结果的语义问题,或者实现技术的时间、空间复杂度较高,因此我们有必要设计一种新的XML查询方法,这种方法独立于XML结构,由查询系统自动查找匹配的XML结构,从而为用户的查询带来便利,实现XML查询引擎和关系查询引擎的无缝集成。我们将这种XML查询方法称之为SQL风格的XML查询方法(Relationa-style XML Query)。   该查询方法所面临的难点主要有两个,一个是性能问题,如何发现合适的树结构,是我们必须解决的问题之一;另一个就是准确性的问题,即便在同一结构中,可能的数据实例也是非常多。本文通过引入amoeba结构和函数依赖来解决目前XML查询方法所无法解决的问题,同时通过合法性检测和查询结果输出格式控制来保证查询的准确性。   与传统的XML查询方法相比,SQL风格的XML查询方法有其明显的优势,我们不再需要去设计严格的模式,这就大大提高了XML的语义表达能力;另外,查询语句不再依赖于XML结构,这就允许用户从多个数据源进行查询。   在文章最后,我们将给出实验数据,来进一步证明该查询方法对多种XML数据和多样性结构的支持。
其他文献
目前,关于数据流系统的研究在传感器网络、金融分析、网络流量监测等领域有着大量应用。而针对数据流本身快速、连续、时变、瞬时等特性,如何为数据流管理系统设计一个具有自适
随着中文信息处理技术的迅猛发展,人们对汉字的信息化需求日益增加。在信息化系统中汉字用一个编码代替,可以实现信息的记录、检索等各种功能。但是,对于汉字本身的信息处理(如
我国处于东亚季风区,主要受来自西伯利亚高压的冬季风和北太平洋高压的西部边缘吹向亚洲东部的夏季风影响。季风的年不均衡性是我国气候灾害形成的主要原因,有重要的研究意义。
随着云计算、大数据和互联网服务的兴起,数据中心中出现了一类轻量级的可扩展的负载,传统的高性能服务器对这类负载的适配性并不是很好,主要体现在服务器计算密度低,资源利用率不
P2P技术的迅速发展给数字图书馆的建设提供了广阔的应用空间。分布式数字图书馆中的一些应用软件在分布式互操作方面具有较大的共通性,若能为它们提供一个通用的P2P应用平台和
随着Internet的快速发展,Web环境已拥有了海量信息。Web信息中包含大量有用的知识:通过Web信息挖掘,我们可以获取这些知识并将加以应用。基于Web的实体关系图的构建就是Web信息
本文提出了动态代码植入技术(Dynamic Code Implantation),它借用半虚拟化的方式,动态修改全虚拟化系统中客户操作系统(Guest OS)的内核代码。在有硬件辅助的全虚拟化虚拟机管理
虚拟植物是应用计算机模拟植物在三维空间中的生长发育状况,是虚拟现实技术在农业领域的应用。其核心内容是生长模型和可视化技术,生长模型反映植物形态结构的动态变化,可视化技
一词多义是普遍现象,而且随着时代的发展和语言的丰富,词义在使用中随时在变化着,这是语言学家也无法准确把握或预测的现象,本文利用索引系统对实体名词的多义进行了分析,希望可以
互联网的飞速发展,信息的迅速膨胀,使得互联网中的网页数量呈指数级别增长。据Google的官方博客公布的最新数据,目前世界网络中存在的网页的数量已经达到了万亿的量级。网络信息